neon s16 8x8 系数矩阵转置

本文介绍了一段NEON汇编代码,该代码实现了s16类型8x8系数矩阵的转置操作。通过特定的加载指令和一系列的数据交换指令,有效地完成了矩阵的转置,为后续的视频解码提供了高效的数据处理方式。
以下代码的功能是实现 s16 类型的 8x8 系数矩阵的转置。在NEON汇编优化视频软解的过程中,该过程能很方便地将数据处理成适合NEON优化的排列方式:

/* step 0 : load data
/* Q4 - Q11 */
vld1.16		{q4,q5},		[r1]!
vld1.16		{q6,q7},		[r1]!
vld1.16		{q8,q9},		[r1]!
vld1.16		{q10,q11},		[r1]!

/* step 1 : transpoese 8X8 matrix */
VTRN.16 q8, q9
VTRN.16 q10, q11
VTRN.16 q4, q5
VTRN.16 q6, q7
VTRN.32 q8, q10
VTRN.32 q9, q11
VTRN.32 q4, q6
VTRN.32 q5, q7

VSWP	d9,	d16
VSWP 	d11,	d18
VSWP	d13,	d20
VSWP	d15,	d22

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值