
机器学习竞赛
文章平均质量分 80
三つ叶
这个作者很懒,什么都没留下…
展开
-
numpy 和 pandas 计算中 axis 的一些理解
pandas中的许多数学运算的函数中往往有 axis 这一个参数,axis 想表达的并不是计算的维度,而是传播的维度 ! 例如: df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75, -1.3]], index=['a', 'b', 'c', 'd'], columns=['one', 'two']) df原创 2021-11-26 16:54:03 · 803 阅读 · 1 评论 -
机器学习竞赛基础知识
1. 线下评估策略 通常在数据竞赛中,参赛者是不能将全部数据都用于训练模型的,因为这会导致没有数据集对该模型的效果进行线下验证。为了解决这一问题,就要考虑如何对数据进行划分,构建合适的线下验证集。针对不同类型的问题,需要不同的线下验证方式,在此分为强时序性和弱时序性。 1.1 强时序性问题 对于含有明显时间序列因素的赛题,可将其看作强时间序行问题,即线上数据的时间都在离线数据集之后,这种情况下就可以采用时间上最接近测试集的数据做验证集 例如,天池平台上的“乘用车零售量预测”竞赛,初赛提供 2012 年 1原创 2021-11-20 20:56:12 · 4872 阅读 · 4 评论