寒老师的一句话,让我启发很大,数据挖掘,重点不在模型和调参,而在于“特征工程”,时刻谨记,要对数据有充足的了解和调查,才能得到好的结果。
这节课讲了3个模型({project1:energy_forcast,project2:havard_energy_forcast,project3:subway_prediction},其中最后一个是Homework,需要对xgboost调参(参考Lesson1模板),前2个可以类比工业界case流程,需要好好研读。
下面符github地址,内含PPT,以及case notebook:https://github.com/wbqjyjy/ML-/tree/master/kaggle%E5%AE%9E%E6%88%98%E6%A1%88%E4%BE%8B/%E8%83%BD%E6%BA%90%E9%A2%84%E6%B5%8B%E4%B8%8E%E5%88%86%E9%85%8D%E6%A1%88%E4%BE%8B%E5%AE%9E%E6%88%98
其中有一篇论文“Probabilistic Electricity Price Forecasting Paper”,主要讲在电力行业,特征工程该怎么做,才能更好的拟合model,从而得到很好的结果,有时间也应该看一看,看看experiment procedure。