深度学习笔记四
本节课讲的内容是分类Classification.
上一节讲的regression主要解决的是输入一串数字,输出一串数字(譬如对股票价格的预测)。跟regression不同的是,classification主要用于针对输入的多维数据,输出一个判断(譬如输入一个图片,判断是什么动物)
有的人尝试使用 regression的方法来做,并且设定假如输出为1,判断为一个类型,输出为-1,判断为另一个类型。
这样有可能会得到好的结果,有可能会得到坏的结果
本图上左边结果是好的,分界线刚好能区分开,但是大多数情况是右图,一旦有一些偏离的很远的data,就会对分界线造成很大的扰动。在Bishop的书上将这种情况描述为:"Penalize to the examples that are too correct"所以其实regression的定义不是很适用于classification的。
理想的模型应该是:
即在f(x)内再内建一个函数g(x),当g(x)>0时,是class1;其余情况,是class2
损耗函数表达的意思是尽量使判断出来的类别和真实的类别不一样的次数最小。
</