- 博客(5)
- 收藏
- 关注
原创 学习打卡: 心电图分类之模型融合
1.1 学习目标学习融合策略1.2 内容介绍模型融合有如下的类型方式:简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boosting/bagging(在xgboost,Adaboost,GBDT中已经用到):多树的提升方法
2021-03-29 00:39:12
397
原创 学习打卡:心电图分类之建模与调参
1.1 学习目标学习机器学习模型的建模和调参流程1.2 模型对比与性能评估1.2.1 逻辑回归1.2.2 决策树模型1.2.3 集成模型集成方法(ensemble method)通过组合多个学习器来完成学习任务,通过集成方法,可以将多个弱学习器组合成一个强分类器,因此集成学习的泛化能力一般比单一分类器要好。集成方法主要包括Bagging和Boosting,Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个更加强大的分类。两种方法都是把若干个分类器整合为一个
2021-03-26 01:22:24
330
原创 学习打卡:心电图心跳信号分类预测的特征工程及其分析方法
1.1 学习目标学习时间序列数据的特征预处理方法学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用1.2 内容介绍数据预处理时间序列数据格式处理加入时间步特征time特征工程时间序列特征构造特征筛选使用 tsfresh 进行时间序列特征处理1.3 代码示例1.3.1 导入包并读取数据# 导入包import pandas as pdimport numpy as npimport tsfresh as tsffrom tsf
2021-03-23 01:01:40
378
原创 学习打卡:心电图心跳信号多分类预测的EDA-数据探索性分析
1.1 EDA 目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡。1.2 内容介绍载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy
2021-03-20 00:05:10
452
3
原创 天池时间序列大赛全流程体验感悟
(Datawhale)天池时间序列大赛实践全流程体验感悟学习目标:学习流程:问题描述:解决方案:学习目标:主要学习了使用docker上传容器镜像至阿里云的镜像仓库,以及实践了镜像的pull、build、push等一系列操作,完成了本地docker环境的配置以及代码的运行,最终提交到远程完成了比赛的全流程体验。学习流程:根据电脑操作系统选择安装相应的Docker(龟速下载,稍安勿躁),安装简单,直接install,但是有坑!!!(见问题描述1)Mac版 DockerWindows版 Dock
2021-02-22 00:39:24
546
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅