自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Datawhale AI夏令营 - 模型蒸馏

1. 数据清洗:采用qwen3-32b对现有数据集进行清理润色,少数超时或空回答,使用qwen3-a232进行补充回答。2. 教师模型微调,选的deepseek-r1-distrill-qwen-7b进行训练,32b应该效果更好,就是太贵了。然后对测试集进行推理,输出cot思维链。3. 学生模型选择deepseek-r1-distrill-qwen-32b进行训练,采用2输出的数据集lora精调,精调参数保持默认,可以优化下。4. 结果比baseline好一些。

2025-07-29 09:15:20 210

原创 Datawhale AI夏令营 - 大模型技术- task1

跑通模型,按着流程跑没问题,只是容易评分失败。

2025-07-25 10:29:23 302

原创 DataWhale AI夏令营 - task2.2 心得

使用llm qwen3:4b 进行商品识别、情绪识别、聚类分析,时间比较慢,而且效果还不如之前。晚点换更好的模型试试。

2025-07-16 23:03:57 218

原创 DataWhale AI夏令营 - task2.1 心得

摘要:task2.1针对文本分类任务进行了三方面优化:1)动态选择聚类数量,通过轮廓系数在5-8范围内确定最优值;2)改进文本预处理,新增HTML标签清理、特殊字符过滤和停用词去除;3)优化模型选择,商品识别改用LogisticRegression,情感分析根据任务选用合适分类器,并扩展TF-IDF特征数量和n-gram范围,从而提升分类准确性。

2025-07-14 23:56:45 227

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除