Shuffle Latency and throughput 对比

instruction                                                latency  1/throughput  

06_2A

VPERM2F128 ymm1, ymm2, ymm3, imm 1 1

VPERMILPD/PS ymm1, ymm2, ymm3 1 1

VSHUFPD/PS ymm1, ymm2, ymm3, imm 1 1


PSHUFB xmm1,xmm2 1 1 1 3 0.5 0.5 1 2

这个不一定,最快 1,0.5 ,2个throuhput


SHUFPD xmm, xmm,imm8,1 1 1 1 1 1 1 1

最快1,1

比整数shuffle慢些

shuffps 

SHUFPS xmm, xmm,imm8,1 1 1 2 1 1 1 1

有些机器上比shuffpd 慢些


INSERTPS xmm1, xmm2, imm 1 1 1 1 1 1

EXTRACTPS xmm1, xmm2, imm 3 2 5 1 1 1

VEXTRACTF128 ymm1, ymm2, imm 1 1            avx



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值