
文字总结
文章平均质量分 73
关于算法原理、概念、发展前景等的文字总结
萌萌哒小公举
这个作者很懒,什么都没留下…
展开
-
基础图像处理+深度学习基本知识
亦称像素点或像元点。即影像单元(picture element)。是组成的最小单元。:是指像素所代表的的地面范围的大小。通常用像元大小、像解率或视场角来表示。指的是图像中存储的信息量,通常为单位英寸中包含的像素点数。原创 2024-12-23 23:17:33 · 413 阅读 · 0 评论 -
Transformer基础知识
忽视词序信息、难以处理多义词、无法捕捉长距离依赖关系、对新词和低频词的表现较差、词向量难以解释、对上下文敏感度较低。注意力机制得到每个词与序列中其他词的关系,但当该词处于一句话中的不同位置得到的权重应该不同。Decoder是一个词一个词输出, 可以对已出的词进行计算,但对未预测的图进行mask。对开始和结束 特征向量,与通过注意力机制后的结果做内积得到问题回答的开始和结果位置。将q1与每一个k的分值转换成概率 ,表示当前词对序列中每一次的关系。其中的位置编码是采用余弦正弦的周期信号。原创 2024-11-04 22:14:13 · 276 阅读 · 0 评论 -
FCN简单总结
全卷积表示:将之前分类网络中的全连接层替换为卷积层。原创 2024-05-11 21:36:55 · 701 阅读 · 0 评论 -
FPN网络结构细节
针对每一个骨干网络上的特征图进行1´1的卷积处理,目的是为了调整不同特征图的通道数,因为不同层次上的特征图通道数是不同的,一般越来越多。针对每一个骨干网络上的特征图进行1´1的卷积处理,目的是为了调整不同特征图的通道数,因为不同层次上的特征图通道数是不同的,一般越来越多。在FPN中可以针对不同特征层预测不同尺度的目标,而Faster R-CNN中所有的不同面积不同比例的Anchor都在一个特征图预测。对于上一层的特征图进行二倍的上采样,即插值,保证了融合上层和下层的特征图高和宽一致。原创 2024-05-11 19:33:28 · 324 阅读 · 1 评论 -
R-CNN Fast R-CNN Faster R-CNN的差异性
R-CNN包括Region proposal(Selective Search)、Feature extraction、Classification(SVM)、Bounding-box regression(regression)四个部分。Faster R-CNN是端对端的网络,Region proposal、Feature extraction、Classification、Bounding-box regression四个部分均融合在CNN网络中。原创 2024-05-11 17:08:08 · 309 阅读 · 1 评论 -
Mask R-CNN网络结构
Mask R-CNN主体结构还是Faster R-CNN,后端并联了一个mask分支Mask R-CNN有两种:一种不带FPN特征金字塔结构的,一种带FPN的,现今以采用FPN结构的为主。原创 2024-05-13 19:11:23 · 1327 阅读 · 0 评论 -
大模型总结
从数据本身找标签,不需要额外提供label,例如语言模型。没有明确目的,从数据分布角度构造损失函数,例如聚类利用少量有标签的数据和大量无标签的数据来训练网络,让学习器不依赖外界交互、自动的利用未标记的样本提升学习性能,就是半监督学习。通常指参数较少、层数较浅的模型,它们具有轻量级、高效率、易于部署等优点,适用于数据量较小、计算资源有限的场景,例如移动端应用、嵌入式设备、物联网等。是指具有大量参数和复杂结构的机器学习模型,能够处理海量数据、完成各种复杂的任务。原创 2024-10-22 20:08:30 · 933 阅读 · 0 评论