从数据到诊断:朴素贝叶斯算法助力肿瘤预测之路

1.案例概述

肿瘤性质的判断影响着患者的治疗方式和痊愈速度。传统的做法是医生根据数十个指标来判断肿瘤的性质,预测效果依赖于医生的个人经验而且效率较低,而通过机器学习有望能快速预测肿瘤的性质。

 2.数据集

本次肿瘤预测使用的数据集共有569组样本。其中,良性肿瘤211例、恶性肿瘤358例。数据集中变量的详细描述如下表所示,表格中的“肿瘤性质”列为目标变量,剩下的字段为特征变量,目前只选取了6个特征变量,在医疗行业中实际用于判断肿瘤性质的特征变量要多得多。      

本案例的目的是根据这些数据搭建朴素贝叶斯模型,帮助医生提高判断效率,从而及早展开治疗。

 3.分析过程

(1)数据读取

import pandas as pd
df = pd.read_excel('肿瘤数据.xlsx')
df.head()

(2)提取特征变量和目标变量

X = df.drop(columns='肿瘤性质') 
y = df['肿瘤性质']

①这里将数据划分为特征变量X目标变量y。对于特征变量X,通过 d

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

律己杂谈

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值