本人优快云博客专栏:https://blog.youkuaiyun.com/yty_7
Github地址:https://github.com/yot777/
散点图的直观解决思路:更近
回到上一节:杨桃的Python机器学习5,我们最终得到了如下的散点图:
蓝色的点(标签为1)似乎都集中在图的左下部分,橙色的点(标签为0)似乎都集中在图的右上部分。
我们在散点图上再增加两个点A和B,想想他们的标签应该分别是什么?
同学们也许大概已经猜出来答案了:
点A和蓝色的点更近,应当是标签1
点B和橙色的点更近,应当是标签0
现在这个“更近”只是直观上的感觉,有没有更科学的计算呢?当然有!这就是欧式距离公式。
一维的距离度量
我们先以一维直线举例,如图:
如图所示,一维直线上有A和B两个点,A点在0的位置,B在5的位置。A点和B点的距离是:|AB|=|5-0|=5
现在增加一个C点在2的位置,请问C点离哪个点更近?
答案是显而易见的,计算两点之间的距离就能知道结果。
C点到A点的距离是:|CA|=|2-0|=|2|=2
C点到B点的距离是:|CB|=|2-5|=|-3|=3 (绝对值)
|CA| < |CB|,因此C点离A点更近。
一般的,两个点 在一维长度的距离公式就是