机器学习数据集pima-indians-diabetes.data 及R语言读入命令

这个数据集是机器学习常用练习集,包括768个observation,原链接如下

https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/

已经失效,原因是permission restriction。

从网上搜索到了数据集的内容,并将其转换为tab分隔的文本文件。

主要参考了优快云博主 姜萌芽 的博文 

文件已上传至共享资源,链接在此 https://download.youkuaiyun.com/download/lf94lf94/11828795

各列数据说明如下:

文件默认是5积分下载, 问下各位如何设成免费下载

也可留言免费发送

或者参考博文,用VIM等自行编辑,乐趣自在其中

R语言可以用如下命令读取并命名header:

diabetes <- read.table(file=“pima-indians-diabetes.data”, sep="\t", header=FALSE) 
names(diabetes) <- c("npregant", "glucose", "BP", "triceps", 
                     "insulin", "bmi", "pedigree", "age", "class") 
diabetes$class <- factor(diabetes$class, levels=c(0,1), 
                         labels=c("normal", "diabetic")) 

 

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值