- 博客(5)
- 收藏
- 关注
原创 贪心算法:会场安排问题
贪心算法:会场安排问题问题重述:会场安排即使用尽可能少的会场来安排给定数量的活动,其中活动的安排必须遵循开始时间和结束时间的约束。简述一下思路,就是运用贪心的思想,先排序,后选择,把活动的结束时间作为排序指标,按从小到大排列,选择时遵循时间上的约束。这里不妨设定一下存储数据的结构为结构体,然后在一个结构体数组里边进行初始化。struct event{ int start;//活动开始时间 int end;//活动结束时间 bool isPlanned;//活动是否被安排过了};使用C++
2021-06-13 10:51:20
561
原创 数据挖掘task5:模型融合
模型融合对于比赛来说:模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boosting...
2020-04-04 19:40:08
305
原创 数据挖掘task4:建模调参
建模调参首先引入数据import pandas as pdimport numpy as npimport warningswarnings.filterwarnings('ignore')def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the da...
2020-04-01 16:31:14
377
原创 数据挖掘task3:特征工程
这里写目录标题特征工程异常值的删除特征构造特征筛选特征工程对于特征工程的描述有许多,这里捡笔者认为重要的说一个特征工程的主要目的还是在于将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的性能。而特征工程的好坏优劣也往往成为各类比赛的关键点,其意义还是决定了它值得各位的重视。而这篇文字主要介绍的是关于异常值,特征构造还有特征筛选的内容以及一些个人理解异常值的删除导入数据部分...
2020-03-28 19:31:17
293
原创 数据挖掘零基础--task2数据分析
EDA数据探索性分析内容摘要载入库载入数据数据总览缺失与异常预测值分布类别特征和数字特征,并对类别特征查看unique分布数字特征分析及可视化类型特征分析及可视化用pandas_profiling生成数据报告对各种python数据库的安装与载入使用jupyter notebook其中绝大多数可以使用pip install指令在cmd界面进行安装,不能的附地址和安装方法...
2020-03-24 13:49:38
325
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅