ollama 本地安装 embedding 模型

ollama本地安装embedding模型教程

最新推荐文章于 2025-09-18 15:58:28 发布

原创最新推荐文章于 2025-09-18 15:58:28 发布 · 1.2k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #langchain #embedding #RAG #自然语言处理 #ollama #LLM

知识库领域的 LLM 大模型和 Embedding 大模型有区别么？为什么在 RAG 领域，需要单独设置 embedding 大模型？　

在人工智能领域，大型语言模型（LLM）和嵌入模型（Embedding Model）是自然语言处理（NLP）中的两大关键技术，尤其在知识库构建和信息检索中发挥着重要作用。　

尽管它们都属于 NLP 范畴，但它们在功能、应用场景和资源需求上存在显著差异。　

Embedding 模型的主要任务是将文本转换为数值向量表示。这些向量可以用于计算文本之间的相似度、进行信息检索和聚类分析。　

Embedding 模型的输出是数值向量。计算机在理解词句含义的时候，是不具备能力的，计算机只能看到一段 01010111 这样的结果。然而，人类看到的词句，是赋予了内部的含义，还带了大量的普世认知。　

参考台大李宏毅老师的一张图，做一下说明。

当我们人类理解猫 vs 狗和狗 vs 花的差异的时候，能自然的理解，觉得猫和狗是更加相近的物种；而狗和花，一个是动物，另一个是植物，偏差会更多。　

那么，如何让计算机能理解这些词背后的含义呢。所使用的技术就是 Embedding。一句话简单说，embedding 就是把计算机无法理解的字词，转换成一个向量矩阵。

比较相似，或者含意比较接近的词向量之间的距离，是更加接近的。比如 dog 和 cat，dog 和 rabbit；然而，flower 和 dog，就会隔得比较远。　

　

Embedding 模型广泛应用于文本相似度计算、信息检索、聚类和推荐系统。　

　

在大模型知识库领域中，单独设置 Embedding 模型可以降低系统资源占用和响应延迟，特别是在大规模知识库构建和信息检索中，可以极大程度提升经济型和效率。一般的应用包含以下几个部分：　

典型应用流程

1. **知识库构建阶段**　

使用Embedding模型将文档转换为向量，存储向量到向量数据库（如FAISS、Milvus）

　

2. **检索阶段**　

用相同的Embedding模型将用户问题转换为向量，在向量数据库中快速检索相似文档

　

3. **回答生成阶段**　

将检索到的相关文档作为上下文，使用LLM生成最终答案

　

推荐的Embedding模型

Crew.ai 官方组件支持的 Embedding 模型有：　

openai：OpenAI 的嵌入模型
google：Google 的文本嵌入模型
azure：Azure OpenAI 嵌入
ollama：使用 Ollama 进行局部嵌入
vertexai：Google Cloud VertexAI 嵌入
cohere：Cohere 的嵌入模型
基岩版：AWS Bedrock 嵌入
huggingface： Hugging Face 模特
watson：IBM Watson 嵌入

　

接下来，我们看一下如何在本地安装 Ollama 提供的 embedding 模型。本案例选用的是 nomic-embed-text。　

项目参考链接：https://ollama.com/search?c=embedding　

　

先激活对应的工作环境。　

source crewai-env/bin/activate

每次开始新的终端会话时，都需要重新激活虚拟环境。如果您看到命令提示符前面有 (crewai) 这样的标识，说明环境已经正确激活。　

安装依赖　

pip install crewai ollama

看到这个代表已经激活　

启动 ollama　

ollama serve

　

安装 embedding 模型　

ollama pull nomic-embed-text

　

因为要配置给其他的服务用，所以需要解决 Ollama 的 embedding host获取问题。　

　

要获取 Ollama 的 embedding host，有以下几种方法：　

默认地址：　

Ollama 默认运行在 http://localhost:11434。如果您是在本地机器上安装的 Ollama，通常不需要更改这个地址。　

如果不确定是否这个端口，验证 Ollama 服务是否运行及其地址，可以按照这个方法执行。　

　

# 检查 Ollama 服务状态
curl http://localhost:11434/api/version

　

看到 11434 的监听结果，说明这个端口就是 ollama 的embedding 模型开放的端口。　

到这一步，就代表着 ollama 的embedding 模型已经安装成功。可以对接给其他的应用和服务了。　

我们该怎样系统的去转行学习大模型？

很多想入行大模型的人苦于现在网上的大模型老课程老教材，学也不是不学也不是，基于此，我用做产品的心态来打磨这份大模型教程，深挖痛点并持续修改了近100余次后，终于把整个AI大模型的学习门槛，降到了最低！

在这个版本当中：

第一您不需要具备任何算法和数学的基础
第二不要求准备高配置的电脑
第三不必懂Python等任何编程语言

您只需要听我讲，跟着我做即可，为了让学习的道路变得更简单，这份大模型教程已经给大家整理并打包，现在将这份 LLM大模型资料 分享出来： 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

一、大模型经典书籍（免费分享）

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

二、640套大模型报告（免费分享）

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、大模型系列视频教程（免费分享）

在这里插入图片描述

四、2025最新大模型学习路线（免费分享）

我们把学习路线分成L1到L4四个阶段，一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：我们会去了解大模型的基础知识，以及大模型在各个行业的应用和分析；学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段是我们的AI大模型RAG应用开发工程，我们会去学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，我们会去学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造我们自己的Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，我们会更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调。

L5阶段：专题集丨特训篇【录播课】

全套的AI大模型学习资源已经整理打包，有需要的小伙伴可以微信扫描下方二维码，免费领取

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。