分类是一种监督学习,体现在输入样本数据学习,然后给定输入,输出分类。
如图所示,样本是(年龄,肿瘤大小)的元组以及肿瘤是否恶性,对其进行监督学习,得到一条直线,直线分类出恶性和良性肿瘤。
本文采用的样本如下,位置为 data\ex.dat
17.650000 2.118750 1.000000
3.150000 14.118750 1.000000
15.650000 18.618750 1.000000
8.150000 16.618750 1.000000
3.150000 6.118750 1.000000
13.650000 1.618750 1.000000
13.150000 -4.881250 1.000000
4.150000 7.618750 1.000000
15.650000 15.618750 1.000000
19.650000 3.618750 1.000000
4.650000 5.118750 1.000000
3.150000 12.618750 1.000000
8.150000 14.618750 1.000000
8.150000 -6.881250 1.000000
11.650000 8.618750 1.000000
3.150000 8.618750 1.000000
10.650000 5.118750 1.000000
13.650000 15.118750 1.000000
6.650000 3.118750 1.000000
6.150000 -1.381250 1.000000
-4.850000 9.118750 1.000000
-4.350000 11.118750 1.000000
-6.350000 4.618750 1.000000
-4.850000 14.118750 1.000000
4.150000 -7.881250 1.000000

本文介绍如何利用Anaconda3环境,通过逻辑回归和梯度下降方法建立一个分类器。样本数据涉及年龄和肿瘤大小,目标是区分恶性与良性肿瘤。代码可以直接在Anaconda3(Python3)中运行,并展示了学习率、迭代次数设置以及分类结果和代价函数变化的图像。
最低0.47元/天 解锁文章
668





