传统AI
文章平均质量分 58
经典CNN等网络结构和任务
blanklog
这个家伙很懒,什么都没留下~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
图像生成模型
从t时刻的扩散噪声中一步步恢复出真实数据分布,模型预测t时刻的噪声,用来采样t-1时刻的图像。第二项无参数,只优化第一项和第三项即可,第一项可看作第三项T=1的情况。推导:逆向过程服从高斯分布,均值和方差跟,x0,xt和扩散参数有关。添加了一个约束假设,既p(z|x)服从N(0,1)分布。的分布 ,然后通过生成器从这个分布中进行采样。的分布 ,然后通过生成器从这个分布中进行采样;假设:前向扩散过程噪声服从N~(0,1)分布。根据 t 时刻的图像预测其t时刻的噪声,使得。的分布与真实的分布相近。原创 2025-03-15 21:27:32 · 220 阅读 · 0 评论 -
YOLO 各系列结构整理
预测 [x,y,w,h,confidence, x1,y2,w2,h2,confidence2,classScore*20], 非anchor形式。预测:[tx,ty,tw,th,confidence, class*20]*5 ,5种anchor。预测:N*N*[3*(1+4+80)] ,每个网格预测三个anchor box。CSPDarknet53 主干,Mish 激活,Dropblock正则化。SPP模块,FPN+PAN,使用anchor的预测形式。原创 2025-03-09 22:34:36 · 840 阅读 · 0 评论 -
CNN SSP, ASPP, PPM 分割任务经典尺度聚合模块
4x4, 2x2,1x1区域的maxpooling,让任意大小图像最终输出最终特征维度始终为 (16+4+1)*256。通过kernal [1,2,3,6] 池化,得到不同尺度的特征图,1x1卷积后上采样到原始尺度cat起来。[6,12,18,inf]的空洞卷积,全局pooling+上采样,之后全部cat起来。让任意大小图像最终输出的特征维度始终固定,便于接全链接层。不进行降采样的前提下,扩大感受野,融合不同尺度的特征。增强模型对多尺度上下文信息的捕获能力。原创 2025-03-14 23:59:40 · 449 阅读 · 0 评论 -
CNN 稠密任务经典结构
3. 卷积块可采用restNetBlock,分离卷积block等。三个网络差不多,UNet名字最直观,后续流传最广的也是Unet。1. 使用padding抱持对称性,直接进行特征cat。2. pixelShuffer作为上采样方式。原创 2025-03-14 23:23:27 · 329 阅读 · 0 评论
分享