机器学习课堂笔记(十八)
机器学习流水线:一个有许多阶段/组件的系统,其中几个可能使用机器学习。
使用固定长宽比的矩形框检测行人
收集矩形样本,有行人的为正样本,其他的为负样本
使用更大的矩形框滑动检测时,将提取的图像压缩为
82×36
得到左边图的方法 对于每一个像素 我们都考察一下 它是不是在左边 这幅图中的某个 白色像素的范围之内 所以比如说 如果某一个像素点 在最左边那幅图中 白色像素点的五或十个像素范围中 那么我们将把右边那幅图的相同像素设为白色。
1、能够将字符从中间分开的块为正样本,其他的为负样本
2、向右滑动矩形窗
每一步都运行分类器
如果正常的话
分类器会告诉我们
应该在什么地方
来将图像分割为独立的字符
这就是用于字符分割的一维滑动窗
一组带标签的样本
通过合成一些额外的干扰
引入不同的背景声音
将一组训练样本扩大成许多组不同的样本
你一定要考虑好
你添加的那些额外的变形量
是有意义的
能让你产生的训练样本
至少在某种程度上
能代表你可能会在测试集中看到的某种图像
关于上限分析
改善文本检测性能提升
17%
改善字符分割性能提升
1%
改善字符识别性能提升
10%
一个更复杂的上限分析的例子、
最后的学习总结、
要感谢 Prof Ng 和Coursera 提供了这么好的课程,希望更多的人能够享受学习这门课的乐趣,并利用这些知识获取更好的生活。