这个数据集是机器学习常用练习集,包括768个observation,原链接如下
https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/
已经失效,原因是permission restriction。
从网上搜索到了数据集的内容,并将其转换为tab分隔的文本文件。
主要参考了优快云博主 姜萌芽 的博文
文件已上传至共享资源,链接在此 https://download.youkuaiyun.com/download/lf94lf94/11828795。
各列数据说明如下:
文件默认是5积分下载, 问下各位如何设成免费下载?
也可留言免费发送。
或者参考博文,用VIM等自行编辑,乐趣自在其中
R语言可以用如下命令读取并命名header:
diabetes <- read.table(file=“pima-indians-diabetes.data”, sep="\t", header=FALSE) names(diabetes) <- c("npregant", "glucose", "BP", "triceps", "insulin", "bmi", "pedigree", "age", "class") diabetes$class <- factor(diabetes$class, levels=c(0,1), labels=c("normal", "diabetic"))