个人本地部署大模型挂载搭建RAG知识库实战记录

Pas0412

已于 2025-06-11 15:17:16 修改

阅读量820

点赞数 5

分类专栏： AI 大模型文章标签： llama ai 语言模型人工智能

于 2024-12-23 19:30:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_48328458/article/details/144675112

版权

AI 同时被 2 个专栏收录

1 篇文章

订阅专栏

1 篇文章

订阅专栏

如题，实际跑一遍发现已经非常简便快捷了，各类文章也很成熟，写一篇记录一下，为后续写开发文档存稿一下，仅供参考。适合想自己本地拉一个模型来简单跑跑或者DIY的AI入门学者

知识面有限，硬件需求不作赘述，提供一个大部分能跑的版本。

本文是私有化部署，效果其实应该跟市面上很多发布AI应用的第三方平台差不多，如果不想私有化本地化可以选择那些平台，字节的扣子、智谱之类的，没用过，不评价。

一、Ollama

用来快速拉模型和部署模型的，支持llama、qwen、Gemma等模型，很方便，下一个这个就完成80%了。

链接：Ollamahttps://ollama.com/

支持Windows， Linux， MacOS

下载完之后默认端口是11434，可以在win+R输入sysdm.cpl后的环境变量里面的高级选项卡-环境变量里修改端口，cache也要加一下，origin设为*可以解决跨域问题（遇到的一个小坑）：

安装完之后打开终端/命令行，运行ollama [命令] [模型], 比如 ollama pull qwen2.5 或者 ollama run llama3，其中pull是拉下来，run是运行，具体的可以从ollama官网右上角Models里面找:

可以看到支持的各种几b几b的参数，比如7b这个是4.7GB，复制右边的命令到命令行就可以拉取+运行。

二、AnythingLLM

用来传文件构建知识库的，原理网上很多，大概就是集成模型嵌入和向量数据库，然后可以支持Ollama和一些如openai的模型。

链接：

Download AnythingLLM for Desktophttps://anythingllm.com/desktop下载安装完按部就班设置下一步就好了，注意如果前面Ollama的默认端口（OLLAMA_HOST）有改的话记得这里也改一下匹配一下，没看到的注意看一下第一页的show advanced settings，小箭头展开。

创建工作区然后就可以上传文件了，至此完成。

网上搜索过程中很多用docker安装的，也有遇到一些坑，比如windows的代理之类的，实际又在mac上跑了一下流程发现没必要用，如果想用openwebui的可以试一下，其实自己随便写一个html网页调试接口就可以了。

博客等级

码龄5年

5
原创

45
点赞

47
收藏

27
粉丝

关注

私信

热门文章

分类专栏

AI 1篇
大模型 1篇
部署 1篇
ubuntu 1篇

展开全部收起

上一篇：: Vue打包静态pdf下载时失败-未发现文件

下一篇：: 实战：阿里云轻量服务器部署前后端分离网站Vue3+Springboot(Maven)项目并购买域名配置

最新评论

Vue打包静态pdf下载时失败-未发现文件
优快云-Ada助手: 非常欣赏您的刻苦钻研精神和不断尝试解决问题的态度。很高兴看到您成功解决了Vue打包静态pdf下载时的问题。除了您提到的绝对路径和相对路径的问题，关于Vue打包静态文件的相关知识还有很多值得深入学习的地方，比如webpack插件的使用、代码分割、路由懒加载等等，这些技能都可以让您的项目更加高效、灵活。希望您继续保持学习的热情，不断挑战自己，期待您更多的精彩博客。如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！

大家在看

零基础上手Conda：安装、创建环境、管理依赖的完整指南 563

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。