
【OpenMMLab训练营】
文章平均质量分 55
Xzavier阿威VVVV
这个作者很懒,什么都没留下…
展开
-
【OpenMMLab实战营打卡-第6课】语义分割算法基础
全卷积网络FCN就是上面这种优化方法,把全连接层全部换成了卷积,这样可以实现任意尺寸的输入。使分割结果从模糊变清晰 是一种概率模型,鼓励仅在原图颜色边界处产生类别变化,内部不发生变化。转置卷积的卷积核可以写成转置矩阵的形式。PSPNet2016就用了多尺度池化得到不同尺度的特征图。应用:医疗影像分析,自动驾驶,遥感影像解译,视频会议。如果滑块的感受野足够大,就可以获取一些上下文信息。空洞卷积:在不增加参数的情况下增大感受野;复用卷积计算,可以降低计算量。语义分割仅考虑像素的类别。上下文:图块周围的信息。原创 2023-02-14 11:30:11 · 151 阅读 · 0 评论 -
【OpenMMLab 实战营打卡-第4课】计算机视觉之目标检测算法基础
在特征图上进行密集预测,实际上就是用卷积去进行滑窗这件事,但是它的效率是远远高于滑窗的。正负样本不均衡:朴素的分类损失无法驱动检测器达到漏检和错检的平衡,通俗来说,就是更加倾向于背景预测。边界框: BoundingBox框指图像上的矩形框 边界横平竖直,包围感兴趣的物体的框。Retina Net是基于focal loss的一阶段的模型,解决了样本不均衡的问题。交并比:交集面积和并集面积的比值,是矩形框重合程度的衡量指标。边界框回归:让模型在预测类别的同时预测边界框的偏移量。问题:效率问题,计算成本特别高。原创 2023-02-07 22:10:27 · 127 阅读 · 0 评论 -
【OpenMMLab实战营打卡 - 第 3 课】MMClassification代码实战
对早期的网络,有全连接层的神经网络,都要求指定的尺寸才能输入到全连接层中。而后续的那些没有全连接层的神经网络,可以兼容任意尺寸的图像。用anaconda创建python环境,module avail可以看到里面所有安装好的程序。北京超级云计算和国家重要信息化基础平台;使用的模型,训练的数据,训练的策略等等。SSH linux平台的控制台。Run文件夹里有300G的容量。训练数据是否固定尺寸?原创 2023-02-04 11:41:57 · 240 阅读 · 0 评论 -
【OpenMMLab实战营打卡 - 第 2 课】图像分类和基础视觉模型
神经结构搜索:让机器搜一些模型出来,接触强化学习等方法搜索最佳网络,是强化学习的逻辑,它的网络结构就没有人工设计的那么规整。神经结构搜索:让机器搜一些模型出来,接触强化学习等方法搜索最佳网络,是强化学习的逻辑,它的网络结构就没有人工设计的那么规整。数据增强:通过简单的变换产生一系列的副本,对训练数据集进行扩充,用更多样化的数据来训练泛化性好的模型,降低标注数据集的成本。数据增强:通过简单的变换产生一系列的副本,对训练数据集进行扩充,用更多样化的数据来训练泛化性好的模型,降低标注数据集的成本。原创 2023-02-03 15:13:22 · 225 阅读 · 0 评论 -
【OpenMMLab实战营打卡 - 第 1 课】CV基础和OpenMMLab介绍
传统计算机视觉的基本原理是设计卷积核,来找到图像的特征的过程。ImageNet是李飞飞教授启动的项目,为计算机视觉算法提供了一个庞大的、高质量的图片库。边缘提取是它的第一步(1964 Larry Roberts),三维提取(1982),人脸检测(2001),现在它们都是opencv的函数了。卷积神经网络是解决这两个问题而诞生的,卷积神经网络局部链接(每个卷积核只参与一部分图像),共享权重,大量节约参数,又有效提取了图像的特征。神经网络的训练流程:计算样本的损失,计算样本损失的梯度,根据梯度信息更新参数。原创 2023-02-01 21:39:46 · 363 阅读 · 0 评论