青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

c++初學者

專注技術開發

sse2指令集

 

1移動指令:

1.       Movaps
movaps XMM,XMM/m128 movaps XMM/128,XMM
把源存儲器內容值送入目的寄存器,當有m128,必須對齊內存16字節,也就是內存地址低4位為0.

2.       Movups
movups XMM,XMM/m128 movaps XMM/128,XMM
把源存儲器內容值送入目的寄存器,但不必對齊內存16字節

3.       Movlps
movlps XMM,m64
把源存儲器64位內容送入目的寄存器低64,64位不變,內存變量不必對齊內存16字節

4.       Movhps
movhps XMM,m64
把源存儲器64位內容送入目的寄存器高64,64位不變,內存變量不必對齊內存16字節.

5.       Movhlps
movhlps XMM,XMM
把源寄存器高64位送入目的寄存器低64,64位不變.

6.       Movlhps
movlhps XMM,XMM
把源寄存器低64位送入目的寄存器高64,64位不變.

7.       movss
movss XMM,m32/XMM
原操作數為m32時:dest[31-00] <== m32      dest[127-32] <== 0
原操作數為XMM: dest[31-00] <== src[31-00] dest[127-32]不變

8.       movmskpd
movmskpd r32,XMM
64位操作數符號位
r32[0] <== XMM[63] r32[1] <== XMM[127] r32[31-2] <== 0

9.       movmskps
movmskps r32,XMM
32位操作數符號位
r32[0] <== XMM[31] r32[1] <== XMM[63] r32[2] <== XMM[95] r32[3] <== XMM[127] r32[31-4] <== 0

10.   pmovmskb
pmovmskb r32,XMM
16位操作數符號位 具體操作同前
r[0] <== XMM[7]   r[1] <== XMM[15]   r[2] <== XMM[23]   r[3] <== XMM[31]
r[4] <== XMM[39]
   r[5] <== XMM[47]   r[6] <== XMM[55]   r[7] <== XMM[63]
r[8] <== XMM[71]
   r[9] <== XMM[79]   r[10] <== XMM[87]   r[11] <== XMM[95]
r[12] <== XMM[103]
 r[13] <== XMM[111]  r[14] <== XMM[119]  r[15] <== XMM[127]  r[31-16] <== 0

11.   movntps
movntps m128,XMM
m128 <== XMM
直接把XMM中的值送入m128,不經過cache,必須對齊16字節.

12.   Movntpd
movntpd m128,XMM
m128 <== XMM
直接把XMM中的值送入m128,不經過cache,必須對齊16字節.

13.   Movnti
movnti m32,r32
m32 <== r32
32寄存器的值送入m32,不經過cache.

14.   Movapd
movapd XMM,XMM/m128 movapd XMM/m128,XMM
把源存儲器內容值送入目的寄存器,當有m128,必須對齊內存16字節

15.   Movupd
movupd XMM,XMM/m128 movapd XMM/m128,XMM
把源存儲器內容值送入目的寄存器,但不必對齊內存16字節.
我感覺這兩條指令同movaps movups 指令一樣,不過又不確定.

16.   Movlpd
movlpd XMM,m64 movlpd m64,XMM
把源存儲器64位內容送入目的寄存器低64,64位不變,內存變量不必對齊內存16字節

17.   Movhpd
movhpd XMM,m64 movhpd m64,XMM
把源存儲器64位內容送入目的寄存器高64,64位不變,內存變量不必對齊內存16字節.

18.   Movdqa
movdqa XMM,XMM/m128 movdqa XMM/m128,XMM
把源存儲器內容值送入目的寄存器,當有m128,必須對齊內存16字節.

19.   Movdqu
movdqu XMM,XMM/m128 movdqu XMM/m128,XMM
把源存儲器內容值送入目的寄存器,但不必對齊內存16字節.

20.   movq2dq
movq2dq XMM,MM
把源寄存器內容送入目的寄存器的低64,64位清零.

21.   movdq2q
movdq2q MM,XMM
把源寄存器低64位內容送入目的寄存器.

22.   Movd
movd XMM,r32/m32 movd MM,r32/m32
把源存儲器32位內容送入目的寄存器的低32,96位清零.
movd r32/m32,XMM
movd r32/m32,MM
把源寄存器的低32位內容送入目的存儲器32.

23.   Movq
movq XMM,XMM/m64 movq MM,MM/m64
把源存儲器低64位內容送入目的寄存器的低64,64位清零.
movq m64,XMM
把源寄存器的低64位內容送入目的存儲器.

2 加法操作

1.       addps
addps XMM,XMM/m128
源存儲器內容按雙字對齊,4個單精度浮點數與目的寄存器相加,結果送入目的寄存器,內存變量必須對齊內存16字節

2.       adds
addss XMM,XMM/m32
源存儲器的低321個單精度浮點數與目的寄存器的低321個單精度浮點數相加,結果送入目的寄存器的低32位高96位不變,內存變量不必對齊內存16字節

3.       addpd
addpd XMM,XMM/m128
源存儲器內容按四字對齊,共兩個雙精度浮點數與目的寄存器相加,結果送入目的寄存器,內存變量必須對齊內存16字節.

4.       addsd
addsd XMM,XMM/m64
源存儲器的低641個雙精度浮點數與目的寄存器的低641個雙精度浮點數相加,結果送入目的寄存器的低64, 64位不變,內存變量不必對齊內存16字節

5.       paddd
paddd XMM,XMM/m128
把源存儲器與目的寄存器按雙字對齊無符號整數普通相加,結果送入目的寄存器,內存變量必須對齊內存16字節.

6.       Paddq
paddq XMM,XMM/m128
把源存儲器與目的寄存器按四字對齊無符號整數普通相加,結果送入目的寄存器,內存變量必須對齊內存16字節.

7.       Paddq
paddq MM,MM/m64
把源存儲器與目的寄存器四字無符號整數普通相加,結果送入目的寄存器.

8.       Pmaddwd
pmaddwd XMM,XMM/m128
把源存儲器與目的寄存器分4組進行向量點乘(有符號補碼操作),內存變量必須對齊內存16字節..
64 | 64
目的寄存器: a0 | a1 | a2 | a3 | a4 | a5 | a6 | a7
源存儲器: b0 | b1 | b2 | b3 | b4 | b5 | b6 | b7
目的寄存器結果: a0*b0+a1*b1 | a2*b2+a3*b3 | a4*b4+a5*b5 | a6*b6+a7*b7

9.       Paddsb
paddsb XMM,XMM/m128 paddsb MM,MM/m64
源存儲器與目的寄存器按字節對齊有符號補碼飽和相加,內存變量必須對齊內存16字節.

10.   paddsw
paddsw XMM,XMM/m128
源存儲器與目的寄存器按字對齊有符號補碼飽和相加,內存變量必須對齊內存16字節.

11.   paddusb
paddusb XMM,XMM/m128
源存儲器與目的寄存器按字節對齊無符號飽和相加,內存變量必須對齊內存16字節.

12.   Paddusw
paddusw XMM,XMM/m128
源存儲器與目的寄存器按字對齊無符號飽和相加,內存變量必須對齊內存16字節.

13.   Paddb
paddb XMM,XMM/m128
源存儲器與目的寄存器按字節對齊無符號普通相加,內存變量必須對齊內存16字節.

14.   Paddw
paddw XMM,XMM/m128
源存儲器與目的寄存器按字對齊無符號普通相加,內存變量必須對齊內存16字節.

15.   Paddd
paddd XMM,XMM/m128
源存儲器與目的寄存器按雙字對齊無符號普通相加,內存變量必須對齊內存16字節.

16.   Paddq
paddq XMM,XMM/m128
源存儲器與目的寄存器按四字對齊無符號普通相加,內存變量必須對齊內存16字節.

17.    

3 減法操作

1.       subps
subps XMM,XMM/m128
源存儲器內容按雙字對齊,4個單精度浮點數與目的寄存器相減(目的減去源),結果送入目的寄存器, 內存變量必須對齊內存16字節.

2.       Subss
subss XMM,XMM/m32
源存儲器的低321個單精度浮點數與目的寄存器的低321個單精度浮點數相減(目的減去源), 結果送入目的寄存器的低32,96位不變,內存變量不必對齊內存16字節

3.       Subpd
subpd XMM,XMM/m128
把目的寄存器內容按四字對齊,兩個雙精度浮點數,減去源存儲器兩個雙精度浮點數, 結果送入目的寄存器,內存變量必須對齊內存16字節.

4.       subsd
subsd XMM,XMM/m128
把目的寄存器的低641個雙精度浮點數,減去源存儲器低641個雙精度浮點數,結果送入目的寄存器的低64, 64位不變,內存變量不必對齊內存16字節

5.       Psubd
psubd XMM,XMM/m128
把目的寄存器與源存儲器按雙字對齊無符號整數普通相減,結果送入目的寄存器, 內存變量必須對齊內存16字節.(目的減去源)

6.       Psubq
psubq XMM,XMM/m128
把目的寄存器與源存儲器按四字對齊無符號整數普通相減,結果送入目的寄存器, 內存變量必須對齊內存16字節.(目的減去源)

7.       Psubq
psubq MM,MM/m64
把目的寄存器與源存儲器四字無符號整數普通相減,結果送入目的寄存器.(目的減去源)

8.       psubsb
psubsb XMM,XMM/m128
源存儲器與目的寄存器按字節對齊有符號補碼飽和相減(目的減去源),內存變量必須對齊內存16字節.

9.       Psubsw
psubsw XMM,XMM/m128
源存儲器與目的寄存器按字對齊有符號補碼飽和相減(目的減去源),內存變量必須對齊內存16字節.

10.   Psubusb
psubusb XMM,XMM/m128
源存儲器與目的寄存器按字節對齊無符號飽和相減(目的減去源),內存變量必須對齊內存16字節.

11.   Psubusw
psubusw XMM,XMM/m128
源存儲器與目的寄存器按字對齊無符號飽和相減(目的減去源),內存變量必須對齊內存16字節.

12.   psubb
psubb XMM,XMM/m128
源存儲器與目的寄存器按字節對齊無符號普通相減(目的減去源),內存變量必須對齊內存16字節.

13.   Psubw
psubw XMM,XMM/m128
源存儲器與目的寄存器按字對齊無符號普通相減(目的減去源),內存變量必須對齊內存16字節.

14.   Psubd
psubd XMM,XMM/m128
源存儲器與目的寄存器按雙字對齊無符號普通相減(目的減去源),內存變量必須對齊內存16字節.

15.   Psubq
psubq XMM,XMM/m128
源存儲器與目的寄存器按四字對齊無符號普通相減(目的減去源),內存變量必須對齊內存16字節.

16.    

4 比較操作

1.       Maxps
maxps XMM,XMM/m128
源存儲器4個單精度浮點數與目的寄存器4個單精度浮點數比較,較大數放入對應目的寄存器,內存變量必須對齊內存16字節.

2.       Maxss
maxss XMM,XMM/m32
源存儲器低321個單精度浮點數與目的寄存器低321個單精度浮點數比較,較大數放入目的寄存器低32,96位不變內存變量不必對齊內存16字節

3.       Minps
minps XMM,XMM/m128
源存儲器4個單精度浮點數與目的寄存器4個單精度浮點數比較,較小數放入對應目的寄存器,內存變量必須對齊內存16字節.

4.       minss
minss XMM,XMM/m32
源存儲器低321個單精度浮點數與目的寄存器低321個單精度浮點數比較,較小數放入目的寄存器低32,96位不變內存變量不必對齊內存16字節

5.       cmpps
cmpps XMM0,XMM1,imm8 imm8是立即數范圍是0~7
根據imm8的值進行4對單精度浮點數的比較,符合imm8的就置目的寄存器對應的32位全1,否則全0
imm8 = 0,目的寄存器等于原寄存器數時,置目的寄存器對應的32位全1,否則全0
imm8 = 1
,目的寄存器小于原寄存器數時,置目的寄存器對應的32位全1,否則全0
imm8 = 2
,目的寄存器小于等于原寄存器數時,置目的寄存器對應的32位全1,否則全0
imm8 = 4
,目的寄存器不等于原寄存器數時,置目的寄存器對應的32位全1,否則全0
imm8 = 5
,目的寄存器大于等于原寄存器數時,置目的寄存器對應的32位全1,否則全0
imm8 = 6
,目的寄存器大于原寄存器數時,置目的寄存器對應的32位全1,否則全0

6.       pcmpeqb
pcmpeqb XMM,XMM/m128
目的寄存器與源存儲器按字節比較,如果對應字節相等,就置目的寄存器對應字節為0ffh,否則為00h內存變量必須對齊內存16字節.

7.       Pcmpeqw
pcmpeqw XMM,XMM/m128
目的寄存器與源存儲器按字比較,如果對應字相等,就置目的寄存器對應字為0ffffh,否則為0000h, 內存變量必須對齊內存16字節

8.       Pcmpeqd
pcmpeqd XMM,XMM/m128
目的寄存器與源存儲器按雙字比較,如果對應雙字相等,就置目的寄存器對應雙字為0ffffffffh,否則為00000000h內存變量必須對齊內存16字節

9.       Pcmpgtb
pcmpgtb XMM,XMM/m128
目的寄存器與源存儲器按字節(有符號補碼)比較,如果目的寄存器對應字節大于源存儲器,就置目的寄存器對應字節為0ffh, 否則為00h,內存變量必須對齊內存16字節

10.   Pcmpgtw
pcmpgtw XMM,XMM/m128
目的寄存器與源存儲器按字(有符號補碼)比較,如果目的寄存器對應字大于源存儲器,就置目的寄存器對應字為0ffffh, 否則為0000h,內存變量必須對齊內存16字節.

11.   Pcmpgtd
pcmpgtd XMM,XMM/m128
目的寄存器與源存儲器按雙字(有符號補碼)比較,如果目的寄存器對應雙字大于源存儲器, 就置目的寄存器對應雙字為0ffffffffh,否則為00000000h,內存變量必須對齊內存16字節.

5 計算操作

1.       rcpps
rcpps XMM,XMM/m128
源存儲器4個單精度浮點數的倒數放入對應目的寄存器,內存變量必須對齊內存16字節
:比如2.0E0的倒數為1÷2.0E0 = 5.0E-1, 這操作只有12bit的精度

2.       rcpss
rcpss XMM,XMM/32
源存儲器低321個單精度浮點數的倒數放入目的寄存器低32,96位不變

3.       rsqrtps
rsqrtps XMM,XMM/m128
源存儲器4個單精度浮點數的開方的倒數放入對應目的寄存器,內存變量必須對齊內存16字節. 比如2.0E0的開方的倒數為1÷√2.0E0 ≈ 7.0711E-1, 這操作只有12bit的精度.

4.       Rsqrtss
rsqrtss XMM,XMM/32
源存儲器低321個單精度浮點數的開方的倒數放入目的寄存器低32,96位不變,內存變量不必對齊內存16字節.

5.    Pavgb
pavgb MM,MM/m64 pavgb XMM,XMM/m128
把源存儲器與目的寄存器按字節無符號整數相加,再除以2,結果四舍五入為整數放入目的寄存器, 源存儲器為m128,內存變量必須對齊內存16字節. :此運算不會產生溢出.

6.    Pavgw
pavgw MM,MM/m64 pavgw XMM,XMM/m128
把源存儲器與目的寄存器按字無符號整數相加,再除以2,結果四舍五入為整數放入目的寄存器, 源存儲器為m128,內存變量必須對齊內存16字節.

7.       Sqrtpd
sqrtpd XMM,XMM/m128
源存儲器兩個雙精度浮點數的開方放入對應目的寄存器,內存變量必須對齊內存16字節.

8.       Sqrtsd
sqrtsd XMM,XMM/m128
源存儲器低641個雙精度浮點數的開方放入目的寄存器低64,64位不變,內存變量不必對齊內存16字節

6 乘法操作

1.       Mulps
mulps XMM,XMM/m128
源存儲器內容按雙字對齊,4個單精度浮點數與目的寄存器相乘,結果送入目的寄存器,內存變量必須對齊內存16字節.

2.       Mulss
mulss XMM,XMM/32
源存儲器的低321個單精度浮點數與目的寄存器的低321個單精度浮點數相乘,結果送入目的寄存器的低32, 96位不變,內存變量不必對齊內存16字節

3.       Mulpd
mulpd XMM,XMM/m128
源存儲器內容按四字對齊,共兩個雙精度浮點數與目的寄存器相乘,結果送入目的寄存器,內存變量必須對齊內存16字節

4.       Mulsd
mulsd XMM,XMM/m128
源存儲器的低641個雙精度浮點數與目的寄存器的低641個雙精度浮點數相乘,結果送入目的寄存器的低64, 64位不變,內存變量不必對齊內存16字節

5.       Pmuludq
pmuludq XMM,XMM/m128
把源存儲器與目的寄存器的低32位無符號整數相乘,結果變為64,送入目的寄存器低64, 把源存儲器與目的寄存器的高64位的低32位無符號整數相乘,結果變為64,送入目的寄存器高64位內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0 | a1 | a2 | a3
源存儲器: b0 | b1 | b2 | b3
目的寄存器結果: b1*a1 | b3*a3

6.       Pmuludq
pmuludq MM,MM/m64
把源存儲器與目的寄存器的低32位無符號整數相乘,結果變為64,送入目的寄存器.

7.       pmulhw
pmulhw XMM,XMM/m128
源存儲器與目的寄存器按字對齊有符號補碼飽和相乘,取結果的高16位放入目的寄存器對應字中. 內存變量必須對齊內存16字節

8.       pmullw
pmullw XMM,XMM/m128
源存儲器與目的寄存器按字對齊有符號補碼飽和相乘,取結果的低16位放入目的寄存器對應字中. 內存變量必須對齊內存16字節.

9.        

7 除法操作

1.    Divps
divps XMM,XMM/m128
目的寄存器共4個單精度浮點數除以源存儲器4個單精度浮點數,結果送入目的寄存器,內存變量必須對齊內存16字節.

2.    Divss
divss XMM,XMM/32
目的寄存器低321個單精度浮點數除以源存儲器低321個單精度浮點數,結果送入目的寄存器的低32, 96位不變,內存變量不必對齊內存16字節

3.    Divpd
divpd XMM,XMM/m128
目的寄存器共兩個雙精度浮點數除以源存儲器兩個雙精度浮點數,結果送入目的寄存器,內存變量必須對齊內存16字節

4.    Divsd
divsd XMM,XMM/m128
目的寄存器低641個雙精度浮點數除以源存儲器低641個雙精度浮點數,結果送入目的寄存器的低64, 64位不變,內存變量不必對齊內存16字節.

8 位操作

1.       Andps
andps XMM,XMM/m128
源存儲器128個二進制位''目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節.

2.       Orps
orps XMM,XMM/m128
源存儲器128個二進制位''目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節.

3.       Xorps
xorps XMM,XMM/m128
源存儲器128個二進制位'異或'目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節.

4.    Unpckhps
unpckhps XMM,XMM/m128
源存儲器與目的寄存器高64位按雙字交錯排列,結果送入目的寄存器,內存變量必須對齊內存16字節.
64 | 64位 
目的寄存器: a0 | a1 | a2 | a3 
源存儲器:  b0 | b1 | b2 | b3 
目的寄存器結果: b0 | a0 | b1 | a1

5.    Unpcklps
 unpcklps XMM,XMM/m128
源存儲器與目的寄存器低64位按雙字交錯排列,結果送入目的寄存器,內存變量必須對齊內存16字節
64 | 64
目的寄存器: a0 | a1 | a2 | a3 
源存儲器:  b0 | b1 | b2 | b3 
目的寄存器結果: b2 | a2 | b3 | a3

6.    Pextrw
pextrw r32,MM,imm8 pextrw r32,XMM,imm8 imm88位立即數(無符號)
從源寄存器中選第imm8(0~3 0~7)個字送入目的寄存器的低16,16位清零.
:imm8范圍為 0~255,當源寄存器為'MM',有效值= imm8 mod 4,當目的寄存器為'XMM',有效值= imm8 mod 8

7.    Pinsrw
pinsrw MM,r32/m32,imm8 pinsrw XMM,r32/m32,imm8
把源存儲器的低16位內容送入目的寄存器第imm8(0~3 0~7)個字,其余字不變
:imm8范圍為 0~255,當目的寄存器為'MM',有效值= imm8 mod 4,當目的寄存器為'XMM',有效值= imm8 mod 8

8.    Pmaxsw
pmaxsw MM,MM/m64 pmaxsw XMM,XMM/m128
把源存儲器與目的寄存器按字有符號(補碼)整數比較,大數放入目的寄存器對應字, 源存儲器為m128,內存變量必須對齊內存16字節

9.    Pmaxub
 pmaxub MM,MM/m64 pmaxsw XMM,XMM/m128
把源存儲器與目的寄存器按字節無符號整數比較,大數放入目的寄存器對應字節, 源存儲器為m128,內存變量必須對齊內存16字節.

10. pminsw
pminsw MM,MM/m64 pmaxsw XMM,XMM/m128
把源存儲器與目的寄存器按字有符號(補碼)整數比較,較小數放入目的寄存器對應字, 源存儲器為m128,內存變量必須對齊內存16字節.

11. Pminub
pminub MM,MM/m64 pmaxsw XMM,XMM/m128
把源存儲器與目的寄存器按字節無符號整數比較,較小數放入目的寄存器對應字節, 源存儲器為m128,內存變量必須對齊內存16字節

12. Maxpd
maxpd XMM,XMM/m128
源存儲器兩個雙精度浮點數與目的寄存器兩個雙精度浮點數比較,較大數放入對應目的寄存器,內存變量必須對齊內存16字節.

13. Maxsd
maxsd XMM,XMM/m128
源存儲器低641個雙精度浮點數與目的寄存器低641個雙精度浮點數比較,較大數放入目的寄存器低64,64位不變內存變量不必對齊內存16字節.

14. Minpd
minpd XMM,XMM/m128
源存儲器兩個雙精度浮點數與目的寄存器兩個雙精度浮點數比較,較小數放入對應目的寄存器,內存變量必須對齊內存16字節.

15. Minsd
minsd XMM,XMM/m128
源存儲器低641個雙精度浮點數與目的寄存器低641個雙精度浮點數比較,較小數放入目的寄存器低64,64位不變內存變量不必對齊內存16字節.

16. Andpd
andpd XMM,XMM/m128
源存儲器128個二進制位''目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節.

17. Andnpd
andnpd XMM,XMM/m128
目的寄存器128個二進制位先取'',''源存儲器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節

18. Orpd
orpd XMM,XMM/m128
源存儲器128個二進制位''目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節.

19. Xorpd
xorpd XMM,XMM/m128
源存儲器128個二進制位'異或'目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節.

20. Pslldq
pslldq XMM,imm8
把目的寄存器128位按imm8(立即數)指定字節數邏輯左移,移出的字節丟失.
imm8 == 1
,代表左移8,imm8 == 2,代表左移16.

21. Psrldq
psrldq XMM,imm8
把目的寄存器128位按imm8(立即數)指定字節數邏輯右移,移出的字節丟失.
imm8 == 1
,代表右移8,imm8 == 2,代表右移16.

22. Psllw
psllw XMM,XMM/m128 psllw XMM,imm8
把目的寄存器按字由源存儲器(imm8 立即數)指定位數邏輯左移,移出的位丟失. 低字移出的位不會移入高字,內存變量必須對齊內存16字節.

23. Psrlw
psrlw XMM,XMM/m128 psrlw XMM,imm8
把目的寄存器按字由源存儲器(imm8 立即數)指定位數邏輯右移,移出的位丟失.
高字移出的位不會移入低字,內存變量必須對齊內存16字節.

24. Pslld
pslld XMM,XMM/m128 pslld XMM,XMM imm8
把目的寄存器按雙字由源存儲器(imm8 立即數)指定位數邏輯左移,移出的位丟失. 低雙字移出的位不會移入高雙字,內存變量必須對齊內存16字節.

25. Psrld
psrld XMM,XMM/m128 psrld XMM,imm8
把目的寄存器按雙字由源存儲器(imm8 立即數)指定位數邏輯右移,移出的位丟失.
高雙字移出的位不會移入低雙字,內存變量必須對齊內存16字節.
pand
pand XMM,XMM/m128
源存儲器128個二進制位''目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節. 我發現與andpd功能差不多,就不知其它特性是否一樣

26. Pandn
pandn XMM,XMM/m128
目的寄存器128個二進制位先取'',''源存儲器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節

27. Por
por XMM,XMM/m128
源存儲器128個二進制位''目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節.

28. Pxor
pxor XMM,XMM/m128
源存儲器128個二進制位'異或'目的寄存器128個二進制位,結果送入目的寄存器,內存變量必須對齊內存16字節.

29. packuswb
packuswb XMM,XMM/m128 packuswb MM,MM/m64
把目的寄存器按字有符號數壓縮為字節無符號數放入目的寄存器低64
把源寄存器按字有符號數壓縮為字節無符號數放入目的寄存器高64
壓縮時負數變為00h,大于255的正數變為0ffh,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0 | a1 | a2 | a3 | a4 | a5 | a6 | a7
源寄存器: b0 | b1 | b2 | b3 | b4 | b5 | b6 | b7
目的寄存器壓縮結果: b0|b1| b2| b3| b4|b5| b6|b7| a0|a1| a2|a3| a4|a5| a6| a7

30. packsswb
packsswb XMM,XMM/m128 packsswb MM,MM/m64
把目的寄存器按字有符號數壓縮為字節有符號數放入目的寄存器低64
把源寄存器按字有符號數壓縮為字節有符號數放入目的寄存器高64
壓縮時小于-128負數變為80h,大于127的正數變為7fh,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0 | a1 | a2 | a3 | a4 | a5 | a6 | a7
源寄存器: b0 | b1 | b2 | b3 | b4 | b5 | b6 | b7
目的寄存器壓縮結果: b0|b1| b2| b3| b4|b5| b6|b7| a0|a1| a2|a3| a4|a5| a6| a7

31. packssdw
packssdw XMM,XMM/m128
把目的寄存器按雙字有符號數壓縮為字有符號數放入目的寄存器低64
把源寄存器按雙字有符號數壓縮為字有符號數放入目的寄存器高64
壓縮時小于-32768負數變為8000h,大于32767的正數變為7fffh,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0 | a1 | a2 | a3
源寄存器: b0 | b1 | b2 | b3
目的寄存器壓縮結果: b0 | b1 | b2 | b3 | a0 | a1 | a2 | a3

32. punpckldq
punpckldq XMM,XMM/m128
把源存儲器與目的寄存器低64位按雙字交錯排列,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0 | a1 | a2 | a3
源寄存器: b0 | b1 | b2 | b3
目的寄存器排列結果: b2 | a2 | b3 | a3

33. punpckhdq
把源存儲器與目的寄存器高64位按雙字交錯排列,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0 | a1 | a2 | a3
源寄存器: b0 | b1 | b2 | b3
目的寄存器排列結果: b0 | a0 | b1 | a1

34. punpcklwd
把源存儲器與目的寄存器低64位按字交錯排列,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0 | a1 | a2 | a3 | a4 | a5 | a6 | a7
源寄存器: b0 | b1 | b2 | b3 | b4 | b5 | b6 | b7
目的寄存器排列結果: b4 | a4 | b5 | a5 | b6 | a6 | b7 | a7

35. punpckhwd
punpckhwd XMM,XMM/m128
把源存儲器與目的寄存器高64位按字交錯排列,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0 | a1 | a2 | a3 | a4 | a5 | a6 | a7
源寄存器: b0 | b1 | b2 | b3 | b4 | b5 | b6 | b7
目的寄存器排列結果: b0 | a0 | b1 | a1 | b2 | a2 | b3 | a3

36. punpcklbw
punpcklbw XMM,XMM/m128
把源存儲器與目的寄存器低64位按字節交錯排列,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0|a1| a2| a3| a4|a5| a6|a7| a8|a9| aA|aB| aC|aD| aE| aF
源寄存器: b0|b1| b2| b3| b4|b5| b6|b7| b8|b9| bA|bB| bC|bD| bE| bF
目的寄存器排列結果: b8|a8| b9| a9| bA|aA| bB|aB| bC|aC| bD|aD| bE|aE| bF| aF

37. punpckhbw
把源存儲器與目的寄存器高64位按字節交錯排列,內存變量必須對齊內存16字節.
64 | 64
目的寄存器: a0|a1| a2| a3| a4|a5| a6|a7| a8|a9| aA|aB| aC|aD| aE| aF
源寄存器: b0|b1| b2| b3| b4|b5| b6|b7| b8|b9| bA|bB| bC|bD| bE| bF
目的寄存器排列結果: b0|a0| b1| a1| b2|a2| b3|a3| b4|a4| b5|a5| b6|a6| b7| a7

38. shufps
shufps XMM,XMM/m128,imm8
把源存儲器與目的寄存器按雙字劃分,imm8(立即數)八個二進制位(00~11,00^11,00~11,00~11)指定排列, 內存變量必須對齊內存16字節.目的寄存器高64位放源存儲器被指定數,目的寄存器低64位放目的寄存器被指定數. '( )'中的都是二進制數
目的寄存器: a(11) | a(10) | a(01) | a(00)
源寄存器: b(11) | b(10) | b(01) | b(00)
目的寄存器排列結果: b(00~11) | b(00~11) | a(00~11) | a(00~11)
目的寄存器壓縮結果'( )'中的值由imm8對應的兩位二進制位指定.
: ( 11 ) ( 10 ) ( 01 ) ( 00 ) ( 11 ) ( 10 ) ( 01 ) ( 00 )
XMM0 = 090a0b0c 0d0e0f11 01020304 05060708 h,XMM1 = 0aabbccdd eeff1234 22334455 66778899 h, imm8 ══> (XMM1 10) (XMM1 01) (XMM0 11) (XMM0 00)
執行shufps XMM0,XMM1,10 01 11 00 b(二進制),XMM0 = 0eeff1234 22334455 090a0b0c 05060708 h

39. shufpd
shufpd XMM,XMM/m128,imm8(0~255) imm8(
操作值) = imm8(輸入值) mod 4
把源存儲器與目的寄存器按四字劃分,imm8(立即數)4個二進制位(0~1,0^1,0~1,0~1)指定排列, 內存變量必須對齊內存16字節.目的寄存器高64位放源存儲器被指定數,目的寄存器低64位放目的寄存器被指定數.
XMM0 = 1111111122222222 3333333344444444 h
XMM1 = 5555555566666666 aaaaaaaacccccccc h,
執行shufpd XMM0,XMM1,101001 1 0 b
XMM0 = 5555555566666666 3333333344444444 h

40. pshuflw
pshuflw XMM,XMM/m128,imm8(0~255)
先把源存儲器的高64位內容送入目的寄存器的高64,然后用imm8將源存儲器的低644個字選入目的寄存器的低64,內存變量必須對齊內存16字節.
源寄存器低64: b(11) | b(10) | b(01) | b(00)
目的寄存器低64位排列結果: b(00~11) | b(00~11) | b(00~11) | b(00~11)
XMM0 = 1111111122222222 3333 4444 5555 6666 h
XMM1 = 5555555566666666 7777 8888 9999 cccc h,
執行pshuflw XMM0,XMM1,10 10 01 10 b
XMM0 = 5555555566666666 8888 8888 9999 8888 h

41. pshufhw
pshufhw XMM,XMM/m128,imm8(0~255)
先把源存儲器的低64位內容送入目的寄存器的低64,然后用imm8將源存儲器的高644個字選入目的寄存器的高64,內存變量必須對齊內存16字節.
源寄存器高64: b(11) | b(10) | b(01) | b(00)
目的寄存器高64位排列結果: b(00~11) | b(00~11) | b(00~11) | b(00~11)
XMM0 = 3333 4444 5555 6666 1111111122222222 h
XMM1 = 7777 8888 9999 cccc 5555555566666666 h,
執行pshufhw XMM0,XMM1,10 10 01 10 b
XMM0 = 8888 8888 9999 8888 5555555566666666 h

42. pshufd
pshufd XMM,XMM/m128,imm8(0~255)
將源存儲器的4個雙字由imm8指定選入目的寄存器,內存變量必須對齊內存16字節.
源寄存器: b(11) | b(10) | b(01) | b(00)
目的寄存器排列結果: b(00~11) | b(00~11) | b(00~11) | b(00~11)
XMM1 = 11111111 22222222 33333333 44444444 h,執行pshufd XMM0,XMM1,11 01 01 10b
XMM0 = 11111111 33333333 33333333 22222222 h

9 數據類型操作

43. cvtpi2ps
cvtpi2ps XMM,MM/m64
源存儲器64位兩個32位有符號(補碼)整數轉為兩個單精度浮點數,放入目的寄存器低64,64位不變.

44. cvtsi2ss
cvtsi2ss XMM,r32/m32
源存儲器132位有符號(補碼)整數轉為1個單精度浮點數,放入目的寄存器低32,96位不變.

45. cvtps2pi
cvtps2pi MM,XMM/m64
把源存儲器低64位兩個32位單精度浮點數轉為兩個32位有符號(補碼)整數,放入目的寄存器

46. cvttps2pi
cvttps2pi MM,XMM/m64
類似于cvtps2pi,截斷取整.

47. cvtss2si
cvtss2si r32,XMM/m32
把源存儲器低321個單精度浮點數轉為132位有符號(補碼)整數,放入目的寄存器.

48. cvttss2si
 cvttss2si r32,XMM/m32
類似cvtss2si,截斷取整.

49. cvtps2pd
cvtps2pd XMM,XMM/m64
把源存儲器低64位兩個單精度浮點數變成兩個雙精度浮點數,結果送入目的寄存器.

50. cvtss2sd
cvtss2sd XMM,XMM/m32
把源存儲器低321個單精度浮點數變成1個雙精度浮點數,結果送入目的寄存器的低64,64位不變.

51. cvtpd2ps
把源存儲器兩個雙精度浮點數變成兩個單精度浮點數,結果送入目的寄存器的低64,64位清零, 內存變量必須對齊內存16字節.
^特殊狀態 3.14E5 (表示負無窮大)

52. cvtsd2ss
cvtsd2ss XMM,XMM/m64
把源存儲器低641個雙精度浮點數變成1個單精度浮點數,結果送入目的寄存器的低32,96位不變.

53. cvtpd2pi
cvtpd2pi MM,XMM/m128
把源存儲器兩個雙精度浮點數變成兩個雙字有符號整數,結果送入目的寄存器,內存變量必須對齊內存16字節. 如果結果大于所能表示的范圍,那么轉化為80000000h(正數也轉為此值).

54. cvttpd2pi
cvttpd2pi MM,XMM/m128
類似于cvtpd2pi,截斷取整.

55. cvtpi2pd
cvtpi2pd XMM,MM/m64
把源存儲器兩個雙字有符號整數變成兩個雙精度浮點數,結果送入目的寄存器.

56. cvtpd2dq
cvtpd2dq XMM,XMM/m128
把源存儲器兩個雙精度浮點數變成兩個雙字有符號整數(此運算與cvtpd2pi類似但目的寄存器變為XMM), 結果送入目的寄存器的低64,64位清零,內存變量必須對齊內存16字節.

57. cvttpd2dq
cvttpd2dq XMM,XMM/m128
類似于cvtpd2dq,為截斷取整.

58. cvtdq2pd
cvtdq2pd XMM,XMM/m128
把源存儲器低64位兩個雙字有符號整數變成兩個雙精度浮點數,結果送入目的寄存器,內存變量必須對齊內存16字節.

59. cvtsd2si
cvtsd2si r32,XMM/m64
把源存儲器低641個雙精度浮點數變成1個雙字有符號整數,結果送入目的寄存器.

60. cvttsd2si
cvttsd2si r32,XMM/m64
類似于cvtsd2si,截斷取整.

61. cvtsi2sd
cvtsi2sd XMM,r32/m32
把源存儲器1個雙字有符號整數變成1個雙精度浮點數,結果送入目的寄存器的低64,64位不變.

62. cvtps2dq
cvtps2dq XMM,XMM/m128
把源存儲器4個單精度浮點數變成4個雙字有符號整數,結果送入目的寄存器,內存變量必須對齊內存16字節.

63. cvttps2dq
cvttps2dq XMM,XMM/m128
類似于cvtps2dq,截斷取整.

64. cvtdq2ps
cvtdq2ps XMM,XMM/m128
把源存儲器4個雙字有符號整數變成4個單精度浮點數,結果送入目的寄存器,內存變量必須對齊內存16字節.

9 備注

1.        MMX指令有864位寄存器(MM0~MM7),不過可惜都是借的FPU, FPU原來有880位寄存器(st(0)~st(7)),現在用在了MMX,所以用之后要加上一條EMMS指令,用以復位.

posted on 2010-08-20 17:53 大海 閱讀(7143) 評論(1)  編輯 收藏 引用 所屬分類: 匯編語言

評論

# re: sse2指令集 2011-09-06 11:04 benqiang

樓主是個好人,居然還自己翻譯,太感謝了。。。  回復  更多評論   

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            狠狠爱www人成狠狠爱综合网| 久久夜色精品一区| 欧美日韩国产综合视频在线观看| aa成人免费视频| 销魂美女一区二区三区视频在线| 国产午夜精品视频免费不卡69堂| 久久九九精品| 久久综合精品一区| 亚洲午夜久久久久久久久电影院| 久久国产手机看片| 亚洲免费观看在线观看| 亚洲一区二区三区国产| 国产精品家教| 久久精品道一区二区三区| 麻豆精品精华液| 久久伊人免费视频| 亚洲欧洲另类国产综合| 99re热这里只有精品视频| 香蕉久久夜色精品国产使用方法| 久久精品成人一区二区三区| 亚洲靠逼com| 久久福利毛片| 亚洲精品免费在线观看| 欧美成人激情视频免费观看| 香蕉久久夜色精品国产| 欧美va日韩va| 欧美国产精品劲爆| 最近中文字幕mv在线一区二区三区四区 | 蜜桃久久av| 在线亚洲精品| 久久综合一区二区| 久久精品动漫| 国产精品二区三区四区| 欧美了一区在线观看| 欧美影院午夜播放| 欧美亚洲日本网站| 亚洲图片你懂的| 久久婷婷色综合| 久久久蜜桃精品 | 亚洲国产精品一区| 性欧美暴力猛交69hd| 亚洲黄色大片| 久久夜色精品国产欧美乱| 欧美在线观看视频一区二区| 欧美国产日本韩| 欧美精品福利| 在线观看亚洲a| 亚洲精品一区二区三区福利| 亚洲国产日韩一区二区| 亚洲高清三级视频| 久久夜色精品国产欧美乱| 欧美一区2区三区4区公司二百| 欧美日韩国产综合久久| 日韩一级二级三级| 亚洲国产免费看| 亚洲精品免费在线播放| 一本色道婷婷久久欧美| 欧美电影免费观看大全| 欧美极品在线观看| 欧美亚州在线观看| 一区二区欧美日韩| 亚洲精选中文字幕| 亚洲宅男天堂在线观看无病毒| 欧美xart系列在线观看| 国语自产精品视频在线看| 亚洲影视在线| 亚洲字幕在线观看| 欧美在线亚洲在线| 国产亚洲精品久久飘花| 亚洲国产精品一区制服丝袜| 麻豆91精品| 亚洲黄色成人久久久| 欧美1区2区3区| 日韩一级免费| 欧美一区二区视频观看视频| 亚洲视频香蕉人妖| 国产三级欧美三级| 欧美成人资源网| 亚洲伊人一本大道中文字幕| 欧美日韩午夜剧场| 午夜视频在线观看一区| 欧美在线精品一区| 欧美日韩一区二区三区在线 | 欧美bbbxxxxx| 欧美日韩国产精品一区| 香蕉乱码成人久久天堂爱免费| 欧美在线三级| 久久久久久久久久久久久9999| **网站欧美大片在线观看| 亚洲国产裸拍裸体视频在线观看乱了| 亚洲午夜视频在线| 欧美伊久线香蕉线新在线| 欧美久久婷婷综合色| 亚洲一区二区三区精品在线观看 | 久久精品亚洲| 久久嫩草精品久久久精品一| 亚洲精品日本| 午夜精品一区二区三区在线视| 午夜久久黄色| 亚洲精品麻豆| 久久久亚洲国产美女国产盗摄| 久久综合给合久久狠狠色| 一区二区三区产品免费精品久久75| 亚洲欧美日韩系列| 亚洲国产精品一区在线观看不卡 | 久久香蕉国产线看观看av| 欧美福利一区| 久久精品中文| 亚洲资源在线观看| 欧美日韩一区二区在线观看视频| 午夜欧美大片免费观看 | 日韩亚洲不卡在线| 久久国产精品99久久久久久老狼| 亚洲精选大片| 国产视频精品xxxx| 亚洲精品视频在线| 伊人成年综合电影网| 亚洲一区二区精品在线| 亚洲欧洲综合| 亚洲欧美韩国| 亚洲自拍偷拍一区| 亚洲国产成人av好男人在线观看| 欧美理论电影在线观看| 欧美成人影音| 一区二区三区自拍| 你懂的视频一区二区| 国产精品视频九色porn| 亚洲免费观看高清在线观看| 亚洲国产黄色| 亚洲精品一区二区三区av| 一区二区三区在线视频免费观看| 看欧美日韩国产| 国产精品视频免费| 一本一道久久综合狠狠老精东影业| 亚洲美女精品久久| 在线视频日本亚洲性| 99热精品在线| 欧美二区乱c少妇| 夜夜嗨av一区二区三区四区| 久久免费黄色| 欧美激情按摩| 亚洲乱码视频| 欧美日韩免费高清一区色橹橹| 亚洲精品久久久久| 99精品热视频| 国产精品www994| 一本色道精品久久一区二区三区| 日韩视频在线一区二区| 欧美日韩系列| 免费成人av| 黄色成人片子| 亚洲毛片av| 亚洲视频自拍偷拍| 欧美日韩午夜在线视频| 久久久女女女女999久久| 欧美暴力喷水在线| 亚洲电影激情视频网站| 国产精品chinese| 久久综合久久美利坚合众国| 亚洲第一天堂无码专区| 欧美第一黄网免费网站| 欧美一区二区在线视频| 久久这里有精品视频| 欧美大色视频| 亚洲午夜av在线| 亚洲嫩草精品久久| 久久久久久网址| 欧美日韩综合在线免费观看| 亚洲伊人观看| 国产精品99久久久久久久vr | 欧美呦呦网站| 欧美激情精品久久久久久大尺度 | 国产精品超碰97尤物18| 一本色道久久88精品综合| 午夜老司机精品| 亚洲国产高潮在线观看| 国产精品萝li| 亚洲精品黄色| 午夜在线一区二区| 欧美日韩不卡合集视频| 亚洲香蕉网站| 欧美福利视频在线| 新片速递亚洲合集欧美合集 | 久久久久久亚洲精品中文字幕| 最新中文字幕亚洲| 亚洲午夜91| aa成人免费视频| 国产日产欧产精品推荐色 | 国产精品99久久久久久白浆小说| 女人香蕉久久**毛片精品| 日韩午夜在线| 亚洲福利国产精品| 亚洲精品中文字| 狼人社综合社区| 亚洲一区国产精品| 亚洲另类黄色| 亚洲男女自偷自拍图片另类| 欧美日韩在线观看一区二区三区| 亚洲二区在线| 亚洲高清久久网|