自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Datawhale AI夏令营-多模态RAG图文问答挑战赛

下面是我目前的一个学习笔记,主要是对赛题的理解。

2025-08-09 15:48:29 650

原创 Datawhale AI夏令营-交叉特征衍生:挖掘用户行为的黄金组合

时间序列特征描绘了用户的生命周期和活跃节奏,而交叉特征则刻画了用户在每一个具体场景下的行为细节和意图。将这两大类特征结合起来,模型就拥有了“时空感知”能力,既能理解一个用户是“刚来的”还是“常客”,也能分辨出这个“刚来的”用户是被一则广告吸引来尝试某个特定功能的,还是只是在应用商店里随便下载看看。希望这些关于交叉特征的思考能给大家带来一些启发。特征工程的探索永无止境,欢迎大家在评论区交流更多有趣的思路!

2025-07-16 21:15:06 423

原创 Datawhale AI夏令营-AI 赋能带货视频评论分析

将海量评论中表达相似观点的文本自动分组,并提炼出每个组的主题词。例如,很多用户都提到“音质清晰”,这就是一个重要的正面观点。需要针对不同倾向(正面、负面、用户场景、疑问、建议)的评论分别进行聚类,且每类聚类数量需控制在5-8个簇,并为每个簇提炼主题词。聚类样本将包含训练集和测试集的所有符合条件的评论。优质的文本表示和合适的聚类算法。文本表示:基础方法。直接学习文档向量。强烈推荐!这些模型能够生成语义上高度相似的句向量,使得相似评论在向量空间中距离更近,从而显著提升聚类效果。讯飞文本向量化模型。

2025-07-13 21:04:13 704

原创 Datawhale AI夏令营-时序特征衍生

设置一个时间阈值(我用了。

2025-07-13 16:23:24 932

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除