ARM NOEN vfmaq_laneq_f32与vextq_f32指令例子

本文详细介绍了ARM NEON指令集中的vfmaq_laneq_f32和vextq_f32指令。通过具体的代码示例,展示了如何使用这些指令进行高效的数据处理和浮点运算,特别是如何利用vfmaq_laneq_f32进行累加乘法操作以及vextq_f32进行数据元素的交错提取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

vfmaq_laneq_f32是乘法运算相关指令,vextq_f32是取数据相关指令。具体功能用文字描述比较麻烦,直接看个列子一下就懂了,所以在这里记录下来。

    float32x4_t sum = vdupq_n_f32(0); //sum={0,0,0,0}
    float _a[] = {1,2,3,4}, _b[] = {5,6,7,8} ;
    float32x4_t a = vld1q_f32(_a), b = vld1q_f32(_b);
    //sum1={5,10,15,20}
    float32x4_t sum1 = vfmaq_laneq_f32(sum, a, b, 0); 
    //sum2={5,10,15,20}+{6,12,18,24} = {11,22,33,44}
    float32x4_t sum2 = vfmaq_laneq_f32(sum1, a, b, 1); 
    //sum3={11,22,33,44}+{7,14,21,28} = {18,36,54,72}
    float32x4_t sum3 = vfmaq_laneq_f32(sum2, a, b, 2);

    float32x4_t r1 = vextq_f32(a,b,1); //r1={2,3,4,5}
    float32x4_t r2 = vextq_f32(a,b,2); //r2={3,4,5,6}
    float32x4_t r3 = vextq_f32(a,b,3); //r3={4,5,6,7}

Reference:
http://blog.youkuaiyun.com/may0324/article/details/72847800
https://developer.arm.com/technologies/neon/intrinsics

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值