第一次接触机器学习的东西,现在看到《机器学习实战》第五章,分享一下学习心得
Logistics回归就是为了找一条能够进行尽最大能力进行分类的拟合线,包括直线和曲线,但是要符合函数,也就是说这条线可以用函数进行表达,不然不能够进行分类。
如上图所示,要用一条直线将绿色的原点与红色的框点进行分成两类,很明显,无法用一条直线能够将他们完全正确的进行分类,因此需要找到一条拟合线尽最大限度进行分类,使得误差最小。如下图所示:
算法比较简单,书中的实现代码也比较好理解,用的事Python语言,在这里主要讲解下书中代码的实现方式,因为有几个人来请教我说算法大概知道,但是书中的代码没看懂。其实书中的代码主要以矩阵的方式处理。
其中从文件中获取原始数据的代码很简单,不做详细说明,贴图即可:
原始数据:
最后一列0和1代表类型,例如1代表绿色的圆点,0代表红色的框点,如果你缺少这个数据文件可以评论区回复我
LoadDataSet函数: