- 博客(4)
- 收藏
- 关注
原创 Datawhale AI夏令营-交叉特征衍生:挖掘用户行为的黄金组合
时间序列特征描绘了用户的生命周期和活跃节奏,而交叉特征则刻画了用户在每一个具体场景下的行为细节和意图。将这两大类特征结合起来,模型就拥有了“时空感知”能力,既能理解一个用户是“刚来的”还是“常客”,也能分辨出这个“刚来的”用户是被一则广告吸引来尝试某个特定功能的,还是只是在应用商店里随便下载看看。希望这些关于交叉特征的思考能给大家带来一些启发。特征工程的探索永无止境,欢迎大家在评论区交流更多有趣的思路!
2025-07-16 21:15:06
423
原创 Datawhale AI夏令营-AI 赋能带货视频评论分析
将海量评论中表达相似观点的文本自动分组,并提炼出每个组的主题词。例如,很多用户都提到“音质清晰”,这就是一个重要的正面观点。需要针对不同倾向(正面、负面、用户场景、疑问、建议)的评论分别进行聚类,且每类聚类数量需控制在5-8个簇,并为每个簇提炼主题词。聚类样本将包含训练集和测试集的所有符合条件的评论。优质的文本表示和合适的聚类算法。文本表示:基础方法。直接学习文档向量。强烈推荐!这些模型能够生成语义上高度相似的句向量,使得相似评论在向量空间中距离更近,从而显著提升聚类效果。讯飞文本向量化模型。
2025-07-13 21:04:13
704
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅