- 博客(6)
- 收藏
- 关注
原创 xgboost的两种使用方法(python代码)
正样本的权重,在二分类任务中,当正负样本比例失衡时,设置正样本的权重,模型效果更好。例如,当正负样本比例为1:10时,scale_pos_weight=10。值越小,越容易过拟合(值较大时,避免模型学习到局部的特殊样本)。含义:训练每棵树时,使用的数据占全部训练集的比例。含义:训练每棵树时,使用的特征占全部特征的比例。含义:在验证集上,当连续n次迭代,分数没有提高后,提前终止训练。含义:学习率,控制每次迭代更新权重时的步长,默认0.3。值越小,越容易欠拟合。含义:树的深度,默认值为6,典型值3-10。
2024-07-05 16:14:48
2046
原创 RAG评估方法-四种方法、两个自动化评估工具,中文/英文RAG评估数据集
RAG自动评估工具,RAG自动数据生成,RAG公开数据集,RAG中文数据集,RAG英文数据集
2024-02-29 18:20:52
13586
4
原创 sklearn中的fit_transform、获取特征、标签转换
sklearn的数据预处理的功能,如fit(),transform()和fit_transform()。获取特征、标签转换
2023-03-03 17:47:02
1295
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人