- 博客(5)
- 收藏
- 关注
原创 Datewhale AI夏令营(机器学习 task3)
此外,还可以计算二阶差分(即差分的一阶差分),以揭示数据变化的加速度。差分特征有助于消除时间序列中的趋势和季节性成分,使数据更加平稳,适合进行进一步的分析和建模。历史平移特征,也称为滞后特征,是通过将时间序列数据向前或向后移动一定的时间单位(如天、月、年等)来创建的。这些特征允许模型访问过去某个时间点的数据,从而捕捉时间序列数据中的时间依赖性和周期性。窗口统计特征是通过在时间序列上滑动一个固定大小的窗口,并在每个窗口内计算统计量(如均值、最大值、最小值、中位数、方差等)来获得的。
2024-07-20 22:04:06
327
原创 Datewhale AI夏令营(机器学习 task2)
与传统的梯度提升树算法在每个节点上都尝试所有特征的切分点不同,LightGBM在构建决策树时采用了按叶子节点分割的策略。:LightGBM将数据按特征值进行离散化,构建直方图并对其进行优化,从而减少了内存消耗和计算时间。:LightGBM采用梯度提升算法,通过迭代地训练多个弱学习器(通常是决策树),并将它们的结果进行加权组合,以形成最终的强学习器。:LightGBM采用了基于直方图的算法和按叶子节点分割的决策树策略,使得其训练和预测速度非常快,尤其适用于处理大规模数据集。
2024-07-17 17:55:54
464
原创 Datawhale AI 夏令营(NLP task2)
基于神经网络解决机器翻译任务的流程:配置环境->数据预处理->训练模型和验证->y用模型翻译。
2024-07-17 17:35:59
580
原创 Datawhale AI 夏令营(机器学习task1)
baseline步骤:1导入库 2读取数据 3计算均值。pandas是基于numpy的数据分析和操作库。numpy用于科学计算,处理大量数学操作。4把均值作为预测结果。
2024-07-14 22:50:50
160
1
原创 Datewhale AI夏令营(NLP task1)
N_EPOCHS增加,模型在训练集上性能可能会持续提升,但在测试集上可能会先升后降。N:训练样本数量,N_EPOCHS:训练轮次。
2024-07-14 21:29:00
145
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人