
性能优化
文章平均质量分 69
程序性能的分析方法以及优化技巧
半块方便面
程序员
展开
-
linux 开发机与测试机建立 ssh 隧道
在建立 ssh 隧道的时候一定要使用 127.0.0.1,使用 localhost 建立隧道,adb 无法识别,不知道问题是什么。原创 2024-10-15 12:02:37 · 398 阅读 · 0 评论 -
内存池可视化
该项目提供了一套 hook 机制用于获取一个 C++ 项目整个声明周期中的内存峰值,并使用 html 呈现出来,源代码采用线程局部内存(TLS)解决if (tls) {if(tls) {} } };这里使用了一个 recur_depth 变量,每次递归 +1,当值大于 0 时直接返回,避免递归调用 malloc。原创 2024-04-22 12:51:48 · 483 阅读 · 0 评论 -
CMYK to RGBA
neon优化 CMYK to RGBA原创 2023-10-08 15:23:10 · 228 阅读 · 0 评论 -
horizontal image flip(Neon优化)
Neon优化像素反转原创 2023-10-08 13:01:01 · 493 阅读 · 0 评论 -
碰撞检测 Neon优化
neon优化碰撞检测原创 2023-10-08 11:21:24 · 127 阅读 · 0 评论 -
NEON矩阵乘法
Neon优化矩阵乘法原创 2023-10-08 11:13:22 · 204 阅读 · 0 评论 -
Adler-32算法使用Neon优化
Neon优化Adler-32算法原创 2023-10-07 18:00:24 · 393 阅读 · 0 评论 -
ARMv8架构简介
armv8架构简介,只介绍了neon指令集、处理器、寄存器部分,其他arm指令集、电源管理、内存单元、缓存等不做介绍,neon开发很少涉及到原创 2023-09-14 12:48:19 · 1354 阅读 · 0 评论 -
ARMv7系统寄存器
本文档介绍 NEON 和 VFP 的系统寄存器,他们用于描述 NEON 和 VFP 的系统架构。包括:FPSCR, FPEXC, FPSID,MVFR0/1.原创 2023-09-14 12:43:42 · 541 阅读 · 0 评论 -
ARMv7处理器
armv7架构的部分处理器原创 2023-09-14 12:42:16 · 836 阅读 · 0 评论 -
ARMv7 Neon指令集
armv7 neon指令集介绍原创 2023-08-28 12:26:06 · 502 阅读 · 0 评论 -
roof-line模型
算力π:计算平台的性能上限,指的是一个计算平台倾尽全力每秒钟所能完成的浮点运算数。单位是 FLOPS or FLOP/s。带宽β:也即计算平台的带宽上限,指的是一个计算平台倾尽全力每秒所能完成的内存交换量。单位是Byte/s。计算强度上限I:两个指标相除即可得到计算平台的计算强度上限。它描述的是在这个计算平台上,单位内存交换最多用来进行多少次计算。单位是FLOPs/Byte。Iπβ。原创 2023-08-24 11:22:26 · 243 阅读 · 0 评论