2020-12-08

本文探讨了糖尿病分类问题,通过机器学习中的KNN、朴素贝叶斯和决策树算法进行实现。实验结果显示,KNN在k值为7时达到最高准确率,手工编写和sklearn库实现的KNN准确率相近。朴素贝叶斯算法中,MultinomialNB、GaussianNB和BernoulliNB各有特点,适用于不同类型的数据。决策树算法也进行了实现。文章分析了不同算法的优缺点,并提供了实验源代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习–糖尿病分类算法

实验目的

  1. 掌握主要分类算法的基本原理与实现。
  2. 比较不同分类算法的结果,分析其优缺点
    实验问题背景
    根据美国疾病控制预防中心统计,现在美国1/7的成年人患有糖尿病。到2050年,这个比例将会增长至1/3。据分析,是否糖尿病患者与怀孕次数,血糖、血压、皮脂厚度、胰岛素、BMI身体质量指数、糖尿病遗传函数、年龄等特征密切相关。通过机器学习预测是否患有糖尿病,具有非常大的应用价值。
    实验问题描述
    现有一份糖尿病患者数据集diabetes.csv,该数据集有768个数据样本,每个样本有8个特征和一个类别标签,具体信息如下:
    在这里插入图片描述

实验要求
1.对数据做适当必要的预处理,将数据集按照3:1分为训练集和验证集。
2.运用决策树、支持向量机、近邻法、贝叶斯等分类算法(至少实现其中两种)实现分类。
3.比较不同分类算法的结果,分析其优缺点。
分析算法实现中关键参数的影响,以曲线等可视化的方式展示。

KNN算法

1.不掉包,自己编程实现
1.编写距离函数:计算测试样本点(也就是待分类点)到其他每个样本点的距离 ,距离使用欧几里得距离
在这里插入图片描述
2.

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值