优化与优化工具

博客提及VTUNE工具很厉害,TI的ccs对5000和6000支持不同,6000的profile工具更强。还探讨了c55imagelib的向量运算及饱和运算优化,完成了transfer16to8copy的优化,同时指出并行算法理解可参考并行体系结构设计。

2004年12月9日13:56:18
VTUNE可真厉害

TI的ccs对5000和6000的支持是不同的,6000的profile工具要强很多。
2004年12月17日13:23:56
一些疑问,在看c55imagelib的threhold阀值时,注意到它采用的向量运算,既一次完成两个16bit加/减法,这个操作与and/or结合使用可以对[0..255]之间的饱和运算优化很大.
完成了对transfer16to8copy的优化从2000cycle到800cycle
其实这些并行算法的理解可以参考并行体系结构的设计,例如mmx的硬件实现,看看硬件是如何支持isa的.

或者参考 Programmable Digital Signal Processors: Architecture, Programming, and Applications

2005年2月3日17:10:29
看了下vtune的tutorial

转载于:https://www.cnblogs.com/embed/archive/2004/12/09/74837.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值