【Datawhale|天池】心跳信号分类预测 (5) - 模型融合

目录

 

融合方法分类

关于 stacking 的补充资料

stacking 和 blending 的区别

经验总结

参考资料


融合方法分类

模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。

  1. 简单加权融合:

    • 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);

    • 分类:投票(Voting)

    • 综合:排序融合(Rank averaging),log融合

  2. stacking/blending:

    • 构建多层模型,并利用预测结果再拟合预测。

  3. boosting/bagging(在xgboost,Adaboost,GBDT中已经用到):

    • 多树的提升方法

 

关于 stacking 的补充资料

img

参考:Kaggle机器学习之模型融合(stacking)心得

 

stacking 和 blending 的区别

Blending,其实和Stacking是一种类似的多层模型融合的形式

  • 其主要思路是把原始的训练集先分成两部分,比如70%的数据作为新的训练集,剩下30%的数据作为测试集。

  • 在第一层,我们在这70%的数据上训练多个模型,然后去预测那30%数据的label,同时也预测test集的label。

  • 在第二层,我们就直接用这30%数据在第一层预测的结果做为新特征继续训练,然后用test集第一层预测的label做特征,用第二层训练的模型做进一步预测

其优点在于

  • 比stacking简单(因为不用进行k次的交叉验证来获得stacker feature)

  • 避开了一个信息泄露问题:generlizers和stacker使用了不一样的数据集

缺点在于:

  • 使用了很少的数据(第二阶段的blender只使用training set10%的量)

  • blender可能会过拟合

  • stacking使用多次的交叉验证会比较稳健

 

经验总结

模型融合是数据挖掘比赛后期上分的主要方式,尤其是进行队伍合并后,模型融合有很多优势。总结一下三个方面:

  1. 结果层面的融合,这种是最常见的融合方法,其可行的融合方法也有很多,比如根据结果的得分进行加权融合,还可以做Log,exp处理等。在做结果融合的时候。有一个很重要的条件是模型结果的得分要比较近似但结果的差异要比较大,这样的结果融合往往有比较好的效果提升。如果不满足这个条件带来的效果很低,甚至是负效果。

  2. 特征层面的融合,这个层面叫融合融合并不准确,主要是队伍合并后大家可以相互学习特征工程。如果我们用同种模型训练,可以把特征进行切分给不同的模型,然后在后面进行模型或者结果融合有时也能产生比较好的效果。

  3. 模型层面的融合,模型层面的融合可能就涉及模型的堆叠和设计,比如加stacking,部分模型的结果作为特征输入等,这些就需要多实验和思考了,基于模型层面的融合最好不同模型类型要有一定的差异,用同种模型不同的参数的收益一般是比较小的。

 

参考资料

https://github.com/datawhalechina/team-learning-data-mining/blob/master/HeartbeatClassification/Task5%20%E6%A8%A1%E5%9E%8B%E8%9E%8D%E5%90%88.md

 

天池心跳信号分类预测是基于卷积神经网络(Convolutional Neural Network,CNN)的一个任务。CNN是一种专门用于处理具有网格状拓扑结构数据的深度学习算法,常用于图像识别和处理方面。 对于天池心跳信号分类预测任务,首先需要准备好心跳信号的数据集,包括心电图信号的采集数据以及对应的标签。然后,可以使用CNN模型对这些心跳信号进行分类预测。 CNN模型的主要思想是通过多层卷积和池化操作来提取信号的特征,并利用这些特征进行分类预测。具体而言,CNN模型由输入层、卷积层、池化层、全连接层和输出层组成。首先,输入层接收心跳信号数据,然后通过卷积层提取信号的局部特征,并通过池化层对特征进行降维。接下来,通过全连接层将数据进行分类,最后在输出层得到分类预测结果。 在训练CNN模型时,通常采用反向传播算法来更新模型的参数,通过最小化损失函数来优化模型分类效果。训练过程中,可以采用一部分数据用于训练,另一部分数据用于验证模型的泛化能力。 总之,天池心跳信号分类预测使用CNN模型进行信号特征提取和分类预测,通过卷积、池化和全连接等操作,充分利用心跳信号的局部特征进行分类判断,从而实现对心跳信号的准确分类预测。这有助于医学领域对心脏疾病等相关问题的研究和诊断。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值