- 博客(5)
- 收藏
- 关注
原创 项目实训学习-大模型微调(二)
基于Qwen-7B蒸馏的开源模型,具备优秀的推理与多任务能力,支持Hugging Face加载。全参数微调的局限显存需求高达数百GB,成本高昂。易过拟合,难以在消费级GPU(如RTX 3090)上实施。核心思想:通过低秩分解()注入可训练参数,冻结原模型权重。优势:仅需训练0.1%~1%参数,显存占用降低约75%,支持动态切换适配器(响应时间<2秒)。QLoRA结合4-bit量化(NF4格式)、双量化与分页优化器,进一步压缩显存需求(单卡48GB可训练65B模型)。
2025-04-25 23:15:00
1346
原创 项目实训-大模型微调学习
微调是连接大模型和真实场景应用的桥梁。对于自己而言,还是感觉有些虚无缥缈,还得去具体实操,在这之前,自己先重点理解思路、掌握基本方法,以便之后操作能更好的理解。
2025-04-24 00:15:00
1700
原创 项目实训开发学习
在开发过程中,调研得到,Cherry Studio 是一款功能强大的 AI 助手工具,支持多种大语言模型服务,便于用户搭建个人知识库。
2025-04-22 16:32:00
891
原创 项目实训个人学习进度
对于机器学习、自然语言处理等领域而言,数据是基础、是土壤。通过这次调研,我了解了如何查找、爬取、处理数据,也体会到了数据质量的重要性。未来希望能学习更多自动化处理工具,如爬虫框架 Scrapy、数据清洗库 Pandas 等,持续提升处理大数据的能力。
2025-04-18 18:23:59
1827
原创 小白ubuntu命令学习
本文档为自己学习Ubuntu时参考其他博主的优秀文章和视频的总结,属于对自己日常学习内容的一次总结和回顾,其中有不对的部分还请批评指正!
2024-12-03 17:15:22
721
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅