计算机视觉:
图像表示:计算机眼中的图像
一张图像被表示成三维数组(三维矩阵)的形式,每个像素的值从0到255,图像中数值越大表示该点越亮,图像中数值越小表示该点越暗;
例如:300*100*3,其中300是图像的长,100是宽,3表示颜色通道的数目,一张JPG图像或者RGB图像,其颜色通道数都是3;
计算机视觉面临的挑战:照射角度改变、形状改变、部分遮蔽、背景混入
机器学习常规套路:1、收集数据并给定标签;2、训练一个分类器;3、测试、评估;
神经网络基础:
1.线性函数(得分函数):从输入--->输出的映射
每个像素点对于得分结果的作用不一样,有些像素点对于它是猫这个类别的得分是促进作用(比如猫的眼睛、耳朵),有的像素点对于它是猫这个类别起到抑制作用(比如背景),不同像素点对应于当前这个类别的重要程度不一样,3072个像素点要对应3072个权重参数,权重参数越大,表示这个像素点对分类结果越重要
权重参数起决定性影响因素,偏置参数起微调作用
计算方法:
权重参数矩阵是通过多次训练不断优化出来的,它是变化的。神经网络在整个生命周期当中所做的事情就是,什么样的W权重参数能更适合于数据去做当前这个任务,就怎么样去改变W,因为w中的值会对最终结果产生决定性影响。
权重参数控制着整个决策边界的走势,偏置参数起微调作用
2.损失函数
损失函数等于0时代表没有损失,此处1是一个,相当于一个容忍程度,也就是正确类别得分至少得比错误类别得分高
以上才是没有损失的。正确类别的损失函数的值越小,代表分类越正确。