自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 【高通hexagon dsp编译环境分析-1】

本文以sdk6.2 calculator_c++ demo为例子讲解了arm及dsp工程及编译脚本,高通的cmake脚本写的比较复杂,我还是习惯用原生xxx.min编译脚本,里面的坑在于c++运行库的设置。

2025-02-09 16:28:10 841

原创 【基于ubuntu 24.04 搭建高通平台dsp及qnn 开发搭建】

本文介绍了ubuntu24.04 系统下安装qpm,qud,qnn,hexagon sdk,mini-dm环境的步骤及踩坑过程。缺啥装啥的思想在这里有些走不通,胡乱安装一通的做法是不行的,因为apt-get自动安装的版本是最新版本,而高通软件依赖的是老版本库。仔细看报错日志深入本源进行分析,找到问题跟因才能解决问题。

2025-02-09 10:55:59 941

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-9】

本文介绍了实现自研dsp/cpu联合profiling trace分析工具的实操环节,虽然没有代码,但是我相信有些聪明的读者已经能明白我的技术路线实现cpu/dsp多进程联合分析的巧妙之处了。后面的文章详细介绍pmu 事件的记录方式及pmu group组的注册、切换、周期性sampler等机制。

2025-02-06 18:29:44 1005

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-8】

本文介绍了Q6 utilization,hvx utilization,hmx utilization,hvx concurrency,core /bus clock等指标的获取。后面的文章继续介绍cache,访存相关分析指标。

2025-02-03 22:59:30 723

原创 【高通hexagon dsp 内的Q6 hvx hmx算力关系的通俗解释】

本文以三种车辆货物运输的例子形象地解释了Q6、hvx、hmx三个算力的关系。Q6、hvx这两个是用户可编程的,hvx有部分高算力指令高通隐藏不暴露,hmx更加封闭,但我研究发现hmx也是有方法不依托qnn独立使用的,这个后面再说。

2025-02-03 13:58:39 412 1

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-7】

本文介绍了hw_thread_concurrency、pCPP、硬件线程负载情况、IPC、MIPS、packet density 这几个指标基于pmu信息的计算方法。后面的文章会介绍dsp Q6核utilization、dsp hvx核utilization、dsp hmx核utilization等指标的计算。

2025-02-02 23:38:43 451

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-6】

本文结合实例剖析了如果将各种观测数据以json格式记录成能被perfetto识别的trace文件的方法。至此itrace工具的整体脉络已经比较清晰了,概括下来:设置合适的pmu group观察组、启动sampler采样线程通过qurt api接口周期性读取pmu 值、通过fastrcp 或async queue将数据传回cpu、cpu存json格式化文件、最后pc web客户端解析进行可视化即可。脚踏实地做的话,有一些工程化工作量。

2025-02-01 13:24:43 960

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-5】

本文介绍了利用配置文件或编译器能力实现一定程度的itrace分析的自动化,通过剖析,我们知道现有工具做的是个什么水平,有哪些不足,是不是核心痛点。

2025-02-01 09:58:31 915

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-4】

本文介绍高通dsp itrace的add events功能、register events功能、 periodic sampler、add marker、add section等几大功能及特点。想要自研性能分析工具,照着itrace功能去做即可,补其短板,加入客制化需求,迭代完善。后面的文章会介绍基于配置文件的自动化功能及怎么存json或protobuf格式的标准trace文件,使能够被perfetto等成熟的web端trace可视化工具识别及展示。

2025-02-01 07:29:56 849

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-3】

本文介绍了我的模仿对象高通dsp itrace 的add events功能、register events功能、 periodic sampler功能及相互关联。高通itrace 提供了libitrace.so 及libritrace_skel.so两个库进行了上述功能的封装,待分析的工程cpu及dsp代码需要分别链接这两个库才行。

2025-01-31 22:20:16 1038

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-2】

做事情要know how,知其然知其所以然。高通pmu介绍比较吝啬,我专门问过高通资深CE也问不出更多信息,不过这块可以参考arm pmu的定义,相互比对这看,道理都是相通的。多于8个pmu寄存器的周期性读取是很底层的东西,也需要一些工程化能力,这也是itrace工具的价值,但它有致命bug,因此不得不再往下挖,用qurt api来实现pmu寄存器的读取。本文介绍了高通dsp sdk中怎么获取pmu寄存器定义,介绍了几种配置/获取pmu的方法及存在的问题及解决方法,欢迎留言交流。

2025-01-31 15:50:50 1059

原创 【从零打造高通平台hexagon dsp profiling性能分析工具-1】

SDP与sysMonApp是两种最常使用的高通cdsp/htp性能分析工具,还有一个近两年出来的qualcomm profiler。cdsp有上百个pmu event,但硬件一次只能抓8个pmu,这就存在矛盾,需要取舍。下一篇介绍怎么巧妙的获取cdsp/htp pmu观测数据…可视化、直观性是工程师对工具永远的追求。

2025-01-30 23:17:31 483

原创 【怎么给高通提case更有效】

对小米、三星等TOP客户,高通技术支持自然比较及时、高效,但国内有不少公司做着高通平台相关开发但没有高通license,没有高通官方有效技术支持,需要借助合作客户的资源间接得到技术支持;或者虽然与高通签的有license但技术支持效率非常低,case沟通推进很费劲;有的大公司不同项目在高通那边立项级别不同,高通分配的技术支持力度也不同,如此种种对研发人员来讲非常尴尬,遇到高通芯片软件相关问题无法得到及时高效的解决。本文讲一讲怎么给高通提case更有效?

2025-01-30 20:25:52 556

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除