模型部署
文章平均质量分 58
ICscholar
分享一些学习记录捏,觉得有用就多多点赞关注下嗷
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
非对称量化和对称量化
xintclipsxz02b−11把浮点数先按步长s缩放、再加零点偏移z,最后截断到可表示的整数范围(这里用的是无符号02b−1xsxint−z2把整数还原回近似的浮点值(xszs2b−1xmax−xminz⌊−sxmin⌋3这样选能让xmin约映射到 0、xmax约映射到2b−1,同时保证x0附近对齐到整数z。原创 2025-08-27 11:08:16 · 626 阅读 · 0 评论 -
深度感知卷积和深度感知平均池化
在深度感知卷积中,模型会根据像素间的深度相似性加权计算卷积操作,以此来保留结构性和细节信息,特别是在深度信息一致的区域。原创 2025-08-26 15:16:50 · 653 阅读 · 0 评论 -
行缓存(line buffer)在图像卷积中的工作方式
AXI4-Stream 按顺序把新像素从右侧送入(虚线箭头,正在进入的是 23、24、25),缓存里的数据整体向左“移位”。(绿色块),与 3×3 卷积核的 9 个系数并行相乘,再经过加法树求和,得到新的输出像素(图中标成 N2)。此刻选中的 3×3 为像素 {2,3,4 / 11,12,13 / 20,21,22}。一句话:图示的是一个随输入像素流滚动的三行缓存,它不断滑动3×3窗口,支持九值并行乘加,从而高效地产生连续的卷积输出。上半部分是一个按行扫描输入的图像块(示例为 9×9,编号 1–81)。原创 2025-08-22 11:26:42 · 539 阅读 · 0 评论 -
十进制数转换至二进制定点数
将十进制数转换成二进制定点数,可以用于将神经网络模型部署至FPGA时对于参数的量化过程原创 2025-02-25 14:55:55 · 521 阅读 · 0 评论 -
top-k神经网络模型剪枝
top-k神经网络模型剪枝原创 2025-02-18 11:14:41 · 740 阅读 · 0 评论 -
浮点数转换为IEEE 754 格式二进制(用于模型部署)
浮点数转换为IEEE 754 格式二进制(用于模型部署)原创 2025-02-13 10:53:36 · 257 阅读 · 0 评论
分享