随机森林算法预测乳腺癌数据集

一、算法思想

威斯康辛乳腺癌数据集:威斯康星州乳腺癌数据集包含699个细针抽吸活检的样本单元,其中 458个为良性样本单元,241个为恶性样本单元。对于每一个样本来说,另外九个变量是与判别恶性肿瘤相关的细胞特征。这些细胞特征得分为1(最接近良性)至10(最接近病变)之间的整数。

这十个变量分别是:肿块厚度(Clump Thickness)、细胞大小的均匀性(Uniformity of Cell Size)、细胞形状的均匀性(Uniformity of Cell Shape)、边际附着力(Marginal Adhesion)、单个上皮细胞的大小(Single Epithelial Cell Size)、裸核(Bare Nuclei)、乏味染色体(Bland Chromatin)、正常核(Normal Nucleoli)、有丝分裂(Mitoses)、Class代表类别(类型变量:2 for benign, 4 for malignant)。

任一变量都不能单独作为判别良性或恶性的标准,建模的目的是找到九

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值