
NEON
vacajk
这个作者很懒,什么都没留下…
展开
-
-00-neon汇编优化实例讲解【ARM NEON加速】
从一个复数点积算法看NEON的汇编优化 由 技术编辑 于 星期五, 03/21/2014 - 15:05 发表 摘要:本文通过一个真实案例(4096点双精度浮点复数点积算法),描述了使用 Zynq-7000 NEON进行算法优化的过程以及一些关键技巧,相对于使用编译器对C代码做优化,性能提升了大约4.8倍。 本文介绍的内容对需要用到NEON实现高性能计算的开发者转载 2017-02-22 12:08:20 · 4808 阅读 · 0 评论 -
-02-实时Prewitt边缘检测,640×480 @60fps【ARM NEON加速】
使用NEON加速处理,实现实时Prewitt边缘检测,640×480 @60fps硬件平台Zynq SoC,FPGA逻辑实现视频采集与视频输出,ARM SoC中使用NEON实现实时Prewitt边缘检测,整体实现640×480 @60fps 处理。图像输出使用了三重缓冲,有效避免了图像撕裂。接口:HDMI输入RGB彩色图像,VGA输出灰度图像。原创 2017-02-23 09:43:22 · 2562 阅读 · 9 评论 -
-03-实时Prewitt边缘检测,第一步:硬件平台搭建【ARM NEON加速】
在上面的一篇里文章”-02-实时Prewitt边缘检测,640×480 @60fps【ARM NEON加速】 “里,提到了实时Prewitt边缘检测的硬件平台,展示了处理效果,还分享了视频下面将详细介绍整个系统的实现过程。原创 2017-03-19 23:36:29 · 3028 阅读 · 0 评论 -
-04-实时Prewitt边缘检测,第二步:Prewitt的NEON加速实现【ARM NEON加速】
下面进行Prewitt的NEON加速设计,将实现的具体思路描述一下。S0. Prewitt的C语言实现我把Prewitt算子的计算过程按下图重新进行表示: 可以看到该算法主要分为了三个步骤去实现:1. 像素灰度化,将源图像数像素点的彩色图像转换为灰度值,使用常用的公式:GRAY=(R*77+G*151+G*28)/2562. x、y方向一阶梯度计算3. 两个方向梯度均方根计算C代码:uns原创 2017-03-20 00:27:01 · 3430 阅读 · 10 评论