有用请点赞,没用请差评。
欢迎分享本文,转载请保留出处。
一、算法
算法原理参考周志华老师的《机器学习》p151和李航老师的《统计学习方法》。
博客内容部分借鉴于腾讯云“海天一树”老师。
二、数据集
本文中的数据集使用的是“皮马印第安人糖尿病数据集”。该数据集由美国国立糖尿病、消化和肾脏疾病研究所(United States National Institute of Diabetes and Digestive and Kidney Diseases,简称NIDDK)提供。这里的“皮马”指的是位于美国亚利桑那州南部的一个县。
该数据集可从 https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv 下载,具体方法是打开此链接后,会看到数据展现在网页中,右击save as,保存类型选为“Microsoft Excel Comman Separated Values File“,即CSV格式,文件名按默认为pima-indians-diabetes.data.csv。
数据内容截图:
数据说明:
源码: