- 博客(4)
- 收藏
- 关注
原创 微调DeepSeek-R1&构建RAG系统(篇二)
使用modelscope的数据集,微调modelscope上的大模型(没使用Swift方法,在modelscope上已经有说明的很清楚了,这里就不再列举了,详见。,阿里的一款共享平台产品,里面也包含了一些模型库数据和数据集数据,可以结合modelscope的sdk直接使用,modelscope有完整的。在modelscope的notebook上完成操作后,如果要把调好的模型传输出来,可以使用modelscope的上传。对于一些难以加载的大模型,可以使用量化的方法,把模型给量化,减少模型的计算和开销。
2025-04-12 16:13:20
820
原创 微调DeepSeek-R1&构建RAG系统(篇一)
我们日常交流中的大模型,普遍指的是大语言模型(Large Language Model,简称LLM),但除了大语言模型外,还有其他的大模型。多模态大模型(同时处理文本、音频、视频等)比如:gpt-4o,可用于生成视频、生成图像等领域;视觉大模型(CV,专注视觉理解与生成)比如:ViT-22B,可用于辅助视觉感知,如智能驾驶自动感知周围环境科学计算大模型(解决科学领域的复杂计算问题),
2025-04-12 15:27:20
941
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人