13、帕金森病模型选择与神经网络决策解释

帕金森病模型选择与神经网络决策解释

1. 帕金森病模型选择

1.1 数据处理与特征选择

在处理帕金森病相关数据时,首先要对完整数据集进行缺失值检查。接着,使用基于决策树的分类器,该分类器对数据缩放不敏感,通过它可以获取分析中每个变量的重要性,进而剔除对分析价值不大的属性。

在特征选择方面,在应用分类算法之前,检查无关特征很重要,因为添加无关特征会增加数据维度,影响模型性能。采用XGBoost算法处理完整数据集,从训练好的模型中提取特征相关性,通过检查交叉验证分数和方差膨胀因子(VIF),最终选择了19个最重要的特征进行分析。

1.2 数据建模准备

将数据集分为X和y,其中X是用于建模的19个独立变量集合,y是输出类,取值为0和1。将独立变量和因变量按70:30的比例拆分,训练集有136行,测试集有59行。先使用训练集参数对所有数据点进行缩放,再转换测试集数据点,确保在验证前测试集对分类器是未知的。

1.3 超参数优化

使用Scikit - learn中的Grid - Search CV函数进行超参数优化。采用五折交叉验证,在一组被认为能提供最佳准确率的参数上训练分类器,将每个分类器的最佳参数集用于在训练集上训练分类器,并在测试集上进行验证。

1.4 分类算法

  • 逻辑回归 :基于Sigmoid函数,可将所有实数输入映射到0到1的范围,主要用于处理概率问题。
  • K近邻(kNN) :基于学习类比,将给定测试元组与训练元组进行比较来确定其类别。在
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值