- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 Datawhale AI夏令营:电商评论用户洞察Baseline优化笔记
本次笔记记录了Datawhale AI夏令营电商评论用户洞察任务的Baseline优化过程。任务包含商品识别、情感分析和评论聚类三个核心环节。优化重点包括:1)将分类器替换为LinearSVC,提高分类性能;2)将TfidfVectorizer的max_features增加到1000,捕获更多文本特征;3)封装聚类函数,动态选择最佳n_clusters(5-8)并使用轮廓系数评估效果;4)增强代码健壮性,加入空数据检查。优化后的Baseline在保持核心功能的同时,提升了模型性能和代码可维护性。
2025-07-13 02:17:37
367
原创 Datawhale AI夏令营 - 用户新增识别赛题优化笔记
【摘要】本文介绍了Datawhale AI夏令营用户新增识别赛题的优化方案。基于官方Baseline,重点优化了特征工程和模型构建:1)解析udmap字段提取botId和pluginId;2)构建用户级聚合统计特征;3)引入TF-IDF行为语义特征;4)设计高阶交叉特征;5)采用LightGBM模型并优化参数。通过5折交叉验证和阈值搜索,显著提升了模型性能。优化方向从事件级建模转向用户级理解,更好地捕捉用户行为模式,最终输出符合评测要求的预测结果。(142字)
2025-07-13 01:39:19
368
原创 Java语言生成二维码
Java语言生成二维码 import com.google.zxing.BarcodeFormat; import com.google.zxing.EncodeHintType; import com.google.zxing.MultiFormatWriter; import com.google.zxing.WriterException; import com.google.zxing.common.BitMatrix; import com.google.zxing.qrcode.decoder.
2020-09-17 22:56:08
287
原创 Java爬虫 --- 爬取王者荣耀英雄图片
Java爬虫 — 爬取王者荣耀英雄图片 import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputSt
2020-09-17 22:47:46
696
原创 零基础理解Java异常,看这篇就够了
异常1. 异常1.1 异常概念1.2 异常分类2. 异常的处理2.1 抛出异常throw2.2 声明异常throws2.3 捕获异常try…catch2.4 finally 代码块2.5 异常注意事项3. 自定义异常3.1 为什么需要自定义异常类3.2 什么是自定义异常类3.3 异常类如何定义 1. 异常 1.1 异常概念 异常,就是不正常的意思。在生活中:医生说你的,身体某个部位有异常,该部位和...
2020-05-01 19:27:52
491
原创 深入了解 JVM 虚拟机(超详细入门攻略)
JVM虚拟机的详细介绍1. 内存模型以及分区2. 堆里面的分区:Eden,survival (from+ to),老年代,各自的特点。3. GC 的两种判定方法4. SafePoint 是什么5. GC 的三种收集方法的优缺点6. JVM 内存分哪几个区,每个区的作用是什么?7. 简述 Java 垃圾回收机制8. 简述 Java 类加载机制9. 类加载器双亲委派模型机制10. 什么是类加载器,类加...
2020-04-29 09:18:27
1325
1
原创 Java基础知识总结(超级详细-面试必备)
Java基础知识汇总1. 面向对象和面向过程的区别a.面向过程b.面向对象2. Java语言有哪些特点3. JVM JRE JDKa. JVMb. JDK 和 JRE4. Java 面向对象编程三大特性: 封装 继承 多态5. Java和C++的区别6. 构造器 Constructor 是否可被 override7. 重载和重写的区别8. 自动装箱与拆箱9. 在一个静态方法内调用一个非...
2020-04-28 23:44:23
714
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅