哈_Alex-优快云博客

原创 Datawhale AI夏令营 - 模型蒸馏

1. 数据清洗：采用qwen3-32b对现有数据集进行清理润色，少数超时或空回答，使用qwen3-a232进行补充回答。2. 教师模型微调，选的deepseek-r1-distrill-qwen-7b进行训练，32b应该效果更好，就是太贵了。然后对测试集进行推理，输出cot思维链。3. 学生模型选择deepseek-r1-distrill-qwen-32b进行训练，采用2输出的数据集lora精调，精调参数保持默认，可以优化下。4. 结果比baseline好一些。

2025-07-29 09:15:20 210

原创 Datawhale AI夏令营 - 大模型技术- task1

跑通模型，按着流程跑没问题，只是容易评分失败。

2025-07-25 10:29:23 302

原创 DataWhale AI夏令营 - task2.2 心得

使用llm qwen3:4b 进行商品识别、情绪识别、聚类分析，时间比较慢，而且效果还不如之前。晚点换更好的模型试试。

2025-07-16 23:03:57 218

原创 DataWhale AI夏令营 - task2.1 心得

摘要：task2.1针对文本分类任务进行了三方面优化：1)动态选择聚类数量，通过轮廓系数在5-8范围内确定最优值；2)改进文本预处理，新增HTML标签清理、特殊字符过滤和停用词去除；3)优化模型选择，商品识别改用LogisticRegression，情感分析根据任务选用合适分类器，并扩展TF-IDF特征数量和n-gram范围，从而提升分类准确性。

2025-07-14 23:56:45 227

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人