- 博客(13)
- 收藏
- 关注
原创 斯坦福李飞飞cs231n 2.2K-最近邻算法
根据在测试集上效果好设置超参数也是坏的,因为还是不知道在未知的数据上的表现。超参数不能通过训练得到最好的,要根据具体问题分析。区别是坐标系改变对L2没影响。
2024-05-17 21:10:52
206
原创 李飞飞cs231n 2.1数据驱动方法
一些的尝试是找到图片中的线条或者拐角,识别一个物体具有的特征。当环境发生一点改变的时候,计算机看到的就会发生巨大改变。语义鸿沟:我们定义的类别和计算机看到的有巨大的差别。缺点是容易出错,每个物体都要有一套规则。对比测试数据和哪个最接近。但它仍然是那个物体。
2024-05-17 20:32:43
302
原创 李飞飞cs231n计算机视觉1.2计算机视觉历史背景
imagenet,2012显著下降,cnn。自从生物发展出了眼睛,生物数量急剧增长。随着年代的变化,图片的质量一直在变。这些都是停留在简单阶段的尝试。再是2.5维草图,开始拼凑。一人写了本书介绍视觉系统。66年第一篇博士论文。先是草图,边缘,线条。全部放在一起就是3D。
2024-05-10 21:40:50
260
3
原创 领域自适应
把网络分为特征提取器和标签分类器,让源数据和目标数据生成的特征分布一样。找到一个特征提取器,对训练和测试资料经过处理之后忽略不同的部分。L:分类越正确越好,Ld:分辨越正确越好,:让L越小越好,Ld越大越好。训练和测试数据有不同分布。
2024-04-26 16:12:46
291
1
原创 Rich feature hierarchies for accurate object detection and semantic segmentation论文笔记
文献的研究目的是为了提高对象检测和语义分割的准确性,特别是在PASCAL VOC这样的标准数据集上。研究的核心是提出一种名为R-CNN(Regions with CNN features)的新型算法,该算法通过结合区域提议和卷积神经网络(CNN)来实现更精确的对象定位和分类。研究方法包括以下几个关键步骤:1. **区域提议提取**:- 使用自底向上的方法,如Selective Search,从图像中提取可能包含对象的区域提议。这些提议作为后续处理的输入。
2024-04-18 23:00:13
1082
1
原创 Fast R-CNN论文阅读笔记
原始网络中的最后一个最大池化层被替换为一个RoI(区域感兴趣)池化层。这个RoI池化层被配置为设置H和W的值,以确保与网络的第一个全连接层兼容(例如,对于VGG16,H和W都设置为7)。
2024-04-18 23:00:01
1017
1
原创 来自人类的恶意攻击
正确率高还不够,需要识别人类的欺骗。加入杂讯,攻击分为有无目标的攻击。根据有无目标设定Loss函数,杂讯还应该尽可能不被人察觉。有两种方式计算怎么样才算不被人察觉。一种是原来的像素平均下来差异小,一种是只看哪个像素差异最大。
2024-04-15 16:38:35
432
1
原创 《计算机视觉中的机器学习:综述》论文笔记
主要有两种类型:模拟图像处理和数字图像处理。关键因素是:1 图像获取2 操控和分析图像3 输出分析后的图像在模拟图像处理中,只能用基础的视觉技术来分析图像。数字图像处理遵循以下三个规则:1 预处理2 增强3 提取信息第一步是把RGB转换成灰度,还有各种预处理、
2024-03-26 20:07:30
421
1
原创 自编码器
自监督学习也叫pre-train,适用于一些不用标注数据的任务,比如做填空题。降维。为什么能成功?图片的变化形式可能只有有限个,用低纬度就能表示。
2024-03-25 22:03:25
361
1
原创 生成式对抗网络(GAN)
我们的目标是让Generator生成的分布和真实的数据越像越好,但是这个距离很难衡量。训练Discriminator的目标是让它能分辨出哪些是G生成的数据,哪些是真实的数据。而跟JS divergence有关。所以有了以下式子:换个distance计算。
2024-03-19 20:42:59
561
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人