数据分析实战之SVM(如何进行乳腺癌预测)

本文利用美国威斯康星州乳腺癌数据集,通过SVM建立分类器,对数据进行清洗、特征筛选,最终得到90%以上准确率的预测模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文根据美国威斯康星州的乳腺癌诊断数据集,生成一个乳腺癌诊断的SVM分类器,并计算这个分类器的准确率。

数据源:https://github.com/cystanford/breast_cancer_data/

1、加载数据源

import pandas as pd
data = pd.read_csv(r'C:\Users\hzjy\Desktop\data.csv')

2、数据探索

查看数据的基本情况:可以看到各字段数据没有缺失

mean 代表平均值,se 代表标准差,worst 代表最大值,后30个特征值实际是10个特征值(radius、texture、perimeter、area、smoothness、compactness、concavity、conc

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值