读书笔记
文章平均质量分 93
《阿里云天池大赛(机器学习篇)》
《Java并发编程实战》
盖盖的博客
众生皆苦,我是草莓味儿的。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
阿里云安全恶意程序检测(速通三)
阿里云安全恶意程序检测原创 2023-11-07 21:15:00 · 488 阅读 · 0 评论 -
阿里云安全恶意程序检测(速通二)
阿里云安全恶意程序检测原创 2023-11-06 20:39:55 · 1122 阅读 · 0 评论 -
阿里云安全恶意程序检测(速通一)
本题目提供的数据来自经过沙箱程序模拟运行后的API指令序列,全为Windows二进制可执行程序,经过脱敏处理:样本数据均来自互联网,其中恶意文件的类型有感染型病毒、木马程序、挖矿程序、DDoS 木马、勒索病毒等,数据总计6亿条。原创 2023-11-04 20:55:39 · 2622 阅读 · 0 评论 -
Java并发编程实战(1)
当多个线程访问某个类时,不管运行时环境采用何种调度方式或者这些线程将如何交替执行,并且在主调代码中不需要任何额外的同步或协同,这个类都能表现出正确的行为,那么这个类就是线程安全的。原创 2023-10-15 16:26:39 · 179 阅读 · 0 评论 -
O2O优惠券预测
本赛题要求提交的结果是预测15 天内用券的概率,这是一个连续值,但是因为用券只有用与不用两种情况,而且评测指标是典型的二分类评测指标AUC,所以这是一个二分类问题。原创 2023-10-15 16:58:39 · 1148 阅读 · 0 评论 -
天猫用户重复购买预测(速通二)
LightGBM分类模型和前面介绍过的LightGBM回归模型相似,它可以支持高效率的并行训练,具有更快的训练速度、更低的内存消耗、更好的准确率、分布式支持、可以快速。原创 2023-10-13 21:03:46 · 1574 阅读 · 0 评论 -
天猫用户重复购买预测(速通一)
本赛题要求预测新用户在6个月内再次从同一店铺购买商品的概率,是一个连续值,不过因为购买商品只有购买和不购买两种结果,而且评测指标是典型的二分类评测指标AUC,所以这是一个二分类问题。原创 2023-10-12 20:13:39 · 3849 阅读 · 2 评论 -
工业蒸汽量预测(速通三)
可以通过合成特征、对特征做简单变换、用决策树创造新特征、特征组合等方法对特征进行优化。原创 2023-09-26 20:19:00 · 617 阅读 · 0 评论 -
工业蒸汽量预测(速通二)
特征工程就是从原始数据提取特征的过程。这些特征可以很好地描述数据。特征工程的处理流程为首先去掉无用特征,去除冗余的特征,如共线特征,并利用存在的特征、转换特征、内容中的特征以及其他数据源生成新特征,然后对特征进行转换(数值化、类别转换、归一化等),最后对特征进行处理(异常值、最大值、最小值,缺失值等),以符合模型的使用。简单来说,特征工程的处理一般包括数据预处理、特征处理、特征选择等工作,而特征选择视情况而定,如果特征数量较多,则可以进行特征选择等操作。原创 2023-09-24 18:51:45 · 1128 阅读 · 0 评论 -
工业蒸汽量预测(速通一)
赛题描述:经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),根据锅炉的工况,预测产生的蒸汽量。数据说明:数据分成训练数据(train.txt)和测试数据(test.txt),其中字段 V0-V37,这38个字段是作为特征变量,target作为目标变量。 选手利用训练数据训练出模型,预测测试数据的目标变量,排名结果依据预测结果的 MSE(mean square error)。结果提交:选手需要提交测试数据的预测结果(txt格式,只有1列预测结果)。结果评估:预测结果以mean squ原创 2023-09-23 20:38:25 · 1508 阅读 · 0 评论
分享