非科班大模型工程师进阶日记
文章平均质量分 73
dession_Wu
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
非科班大模型工程师进阶日记(〇)
这个GitHub开源项目(mlabonne/llm-course)提供了学习大语言模型(LLM)的完整路线图,包含三个模块:基础知识(数学/Python/神经网络)、LLM科学家(模型构建技术)和LLM工程师(应用开发部署)。项目采用开源免费形式,适合从零开始学习AI大模型。作者选择了第三条路径——LLM工程师方向,计划从"运行LLMs"环节开始实践。该项目特色在于系统化整理学习资源,而非硬核技术创新。原创 2025-05-28 15:05:09 · 265 阅读 · 0 评论 -
进阶日记(一)大模型的本地部署与运行
本文介绍了本地部署大语言模型的具体步骤,主要包括:1.使用Ollama工具下载并运行DeepSeek模型;2.通过Docker部署RAGflow构建个人知识库。文章详细说明了Ollama的环境变量配置方法、模型选择建议,以及Docker安装过程中可能遇到的问题解决方案。虽然技术门槛较高,但作者提供了相关背景知识链接和详细教程参考,帮助读者理解本地化部署大模型的原理和操作流程,实现基于个人知识库的智能问答功能。原创 2025-06-01 23:02:36 · 930 阅读 · 0 评论
分享