吸取教训:做事情一定要要形成文档

在将本地识别引擎移植到iPhone过程中,遇到识别效率低下问题。经排查,原因是iPhone对neon指令支持不佳,导致矩阵乘法耗时过多。文中通过对比实验证实此问题,并提出采用汇编指令优化方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这两天在做本地识别引擎往iphone上移植的事情,遇到一些困难。在移植工作基本完成后,遇到效率问题,识别引擎在iphone上识别效率特别低,在iphone5上识别一句话需要10s左右,经过在内核代码中打LOG发现时MLP模块的矩阵乘法耗时较多,大概是安卓设备上的10倍。因此定位到效率问题是因为iphone手机对neon指令的支持不是很好。做了一个实验:使用arm_neon.h中的指令和neon汇编指令分别实现了一个小函数,跑10000000遍,看时间。在安卓设别上耗时基本差不多,汇编稍微快一点;而在iphone手机上内联函数的时间是汇编指令的4倍!因此,使用汇编指令实现矩阵乘法势在必行。

但是,这个时候遇到了很大的困难,我不指导该怎么把源代码编成汇编指令,这个事情weizhang2之前做过,我去问他,他忘了当时用的什么工具了。因为当时没有形成文档,导致失忆后就记不住了。要吸取教训。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值