자기개발/SIMD
SIMD - Intrinsics 세트 함수(값 입력 함수)
pi92
2021. 10. 8. 17:43
__m128i 변수의 pack안에 값을 개별적으로 입력할 수 있도록 지원해 주고 있다. 세트함수들은 SIMD 명령어보다 사용하기 편리하게 되어있다.
__m128i r = _mm_setzero_si128()
: 모두 0으로 초기화 한다.
__m128i r => 0 0 0 0 0 0 0 0
__m128i r = _mm_set_epi16(short w7, short w6, short w5, short w4, short w3, short w2, short w1, short w0)
: 16bit short 값 8개를 입력받아 128bit r 값에 세트한다.
__m128i r => w7 w6 w5 w4 w3 w2 w1 w0
__m128i r = _mm_set1_epi16(short w)
:16bit short 값 1개를 입력받아 모두 같은 값으로 128bit r 값에 세트한다.
__m128i r => w w w w w w w w
__m128i r = _mm_setr_epi16(short w7, short w6, short w5, short w4, short w3, short w2, short w1, short w0)
: 16bit short 값 8개를 입력받아 반대 순서대로 128bit r 값에 세트한다.
__m128i r => w0 w1 w2 w3 w4 w5 w6 w7
사용 예제
#include <iostream>
#include <afx.h>
using namespace std;
#include <emmintrin.h>
int main(int argc, char* argv[])
{
__declspec(align(16)) short R[8] = { 1, 1, 1, 1, 1, 1, 1, 1};
__m128i xmmR = _mm_setzero_si128(); // 0으로 초기화
_mm_store_si128((__m128i*)R, xmmR); //결과 출력
cout << "Setzero : " << R[7] << ", " << R[6] << ", " << R[5] << ", " << R[4] << ", " << R[3] << ", " << R[2] << ", " << R[1] << ", " << R[0] << endl;
xmmR = _mm_set_epi16(8,7,6,5,4,3,2,1); // 순서대로 입력
_mm_store_si128((__m128i*)R, xmmR); //결과 출력
cout << "Set : " << R[7] << ", " << R[6] << ", " << R[5] << ", " << R[4] << ", " << R[3] << ", " << R[2] << ", " << R[1] << ", " << R[0] << endl;
xmmR = _mm_set1_epi16(9); // 1개의 값으로 모두 입력
_mm_store_si128((__m128i*)R, xmmR); //결과 출력
cout << "Set1 : " << R[7] << ", " << R[6] << ", " << R[5] << ", " << R[4] << ", " << R[3] << ", " << R[2] << ", " << R[1] << ", " << R[0] << endl;
xmmR = _mm_setr_epi16(8, 7, 6, 5, 4, 3, 2, 1); //역순으로 입력
_mm_store_si128((__m128i*)R, xmmR); //결과 출력
cout << "SetR : " << R[7] << ", " << R[6] << ", " << R[5] << ", " << R[4] << ", " << R[3] << ", " << R[2] << ", " << R[1] << ", " << R[0] << endl;
return 0;
}
실행 결과