MNN NC4HW4

wuqi1003

于 2024-11-24 15:44:03 发布

阅读量196

点赞数 8

文章标签： mnn 人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wuqi1003/article/details/144008611

版权

图解神秘的NC4HW4 ：

https://cloud.tencent.com/developer/article/1748441 ，

根据按行处理特点, 对于Feature和kernel的宽不是4倍数进行处理, 会出现错误. 图中的kernel很明显以已经到了第二行的值。那么有没有方法在按行处理的思想上, 一次处理4个数,而不受影响.答案是有的, 即NC4HW4.即把前4个通道合并在一个通道上, 依次类推, 在通道数不够4的情况下进行补0。

https://www.zhihu.com/question/337513515 ，

自己总结：

NHWC: R1G1B1R2G2B2R3G3B3...R16G16B16

NCHW: R1R2R3...R16G1G2G3...G16B1B2B3...B16,

NC4HW4: R1G1B100000 R2G2B200000 R3G3B300000 补5个零，

实例：

float *dstDat =

[0] 82, [1]84, [2]84, [3]84, [4]85 ... , 这是第一channel，

[262144=512*512]141, [..45]143, [..46]143, [..47]143, [..48]144, [..49]145, 这是第二channel，

[524288=512*512*2]156, [..89]158, [..90]158, [..91]158, [..92]159, [..93]160, [..94]157, [..95]156, [..96]159, 这是第三channel，

用dstDat create一个nchwTensor, 再经copyFromHostTensor拷贝到input Tensor后，最后用一个 float *outDat 读出 input Tensor host内容以便查看，

float *outDat = （即input Tensor host内容）

82, 141, 156, 0, 0, 0, 0, 0, 84, 143, 158, 五个零, 84,143,158, 五个零, 84,143,158, 五个零... ...

博客等级

码龄13年

63
原创

173
点赞

139
收藏

89
粉丝

关注

私信

热门文章

分类专栏

C语言 12篇
硬件 1篇
嵌入式 1篇
VScode 1篇
arm汇编 9篇
notepad++ 4篇
Source Insight 2篇
计算机基础
感想 1篇

展开全部收起

最新评论

extern c详细用法
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)使用更多的站内链接；(3)提升标题与正文的相关性。
notepad++ 双击高亮|多格式标记
优快云-Ada助手: 你使用 Notepad 的时候，通常会打开多少个文件？

大家在看

Java 后台开发中 CPU 飙高原因及解决方案深度解析

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。