
数据竞赛
雪糕cool
技术可以不牛逼,身材一定要好,要坚持哦✊
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据竞赛(一)
代码如下:原创 2019-07-24 22:02:24 · 152 阅读 · 0 评论 -
数据竞赛(一)
代码如下:原创 2019-07-24 22:04:48 · 135 阅读 · 0 评论 -
数据竞赛(三)特征构造与特征选择
"数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。" 特征构造与特征选择十分重要,本文学习了一些特征构造和选择方法。 一、特征构造 # 合并车站 data['bus_sub_num'] = data['subwayStationNum']+data['busStationNum'] # 合并学校 data['school_num'] = da...原创 2019-07-30 01:47:11 · 502 阅读 · 0 评论 -
数据竞赛(二)数据清洗
一、缺失值分析 #找出有缺失值的列: pv uv 在训练集和测试集中均有缺失 train = pd.read_csv('train_data.csv') test = pd.read_csv('test_a.csv') train.info() test.info() 输出: <class 'pandas.core.frame.DataFrame'> RangeIndex: ...原创 2019-07-26 21:49:05 · 356 阅读 · 0 评论 -
数据竞赛(四)模型及调优
一、模型 1. GBDT GBoost = GradientBoostingRegressor(n_estimators=3000, learning_rate=0.04, max_depth=6, max_features='sqrt', min_sa...原创 2019-08-02 01:13:00 · 645 阅读 · 0 评论