
天池数据比赛
清水寺种辣椒
越是憧憬,越要风雨兼程。
展开
-
Anaconda3下XGBoost的安装与配置
Anaconda3下XGBoost的安装与配置XGBoost作为一种数据挖掘比赛常用算法,其使用频率不言而喻。而XGBoost算法在Python中只支持Python3的版本,同时Anaconda非常适合大数据量处理,所以介绍Anaconda3的安装过程以及XGBoost在Anaconda下的安装。XGBoost安装只支持Python3,如图: Anaconda3的下载地址可以从官网上下载,但是原创 2017-10-26 20:07:06 · 4763 阅读 · 0 评论 -
XGBoost基本参数与调参
XGBoost基本参数理解与设置本文讨论XGBoost使用过程中调试参数的基本意义与设置,参考于一篇国外大佬文章。链接在此。一、基本参数1. booster [default : gbtree](1) gbtree:以树为基础的模型。 (2) gbliner:线性模型。2. silent [default : 0]设置为1时起作用(也就是运行时,不打印相关原创 2018-01-18 21:36:45 · 1573 阅读 · 0 评论 -
seaborn绘制热力图坐标标签
seaborn绘制热力图坐标标签调整seaborn中的热力图,有利于数据特征的关联性表示,除去导入部分,绘制部分代码如下:mpl.rcParams['font.sans-serif'] = ['FangSong']corrmat = train.corr()f,ax = plt.subplots(figsize=(12,9))ax.set_xticklabels(corrmat,原创 2018-01-22 19:21:58 · 24220 阅读 · 1 评论 -
天池大数据竞赛——糖尿病遗传风险预测赛后总结(二)
天池大数据竞赛——天池精准医疗大赛人工智能辅助糖尿病遗传风险预测赛后总结天池大数据竞赛官方网址(链接)六、预测算法1. LightGBM LightGBM利用基于histogram的算法,通过将连续特征(属性)值分段为discrete bins来加快训练的速度并减少内存的使用。直方图算法的基本思想:先把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图。遍...原创 2018-06-04 16:51:33 · 7860 阅读 · 21 评论 -
【天池大数据竞赛】“数智教育”2019数据可视化竞赛亚军方案总结
【天池大数据竞赛】“数智教育”2019数据可视化竞赛亚军方案总结 “数智教育”是我第二次参加天池的可视化的竞赛,对于我们来说,比赛最吸引人的地方在于天池的竞赛数据基于真实应用场景,在系统的设计与开发的过程,去解决一些实际应用的问题,是一件“让技术有温度”的事儿。在比赛的过程,我们锻炼了我们数据分析的能力,前端开发能力和可视化方面的知识。答辩的过程,也让我们开阔了视野和思路,受益良多~下面为...原创 2019-08-22 15:52:55 · 6443 阅读 · 9 评论