深度学习-82-大语言模型LLM之基于langchain加载本地文档向量存储后检索

皮皮冰燃

于 2025-01-08 14:32:26 发布

阅读量469

点赞数 5

分类专栏：深度学习文章标签：深度学习语言模型 langchain

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_20466211/article/details/144986922

版权

深度学习专栏收录该内容

161 篇文章 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

1 langchain
2 加载文档(document_loaders)
3 嵌入模型(OllamaEmbeddings)
4 向量存储(FAISS)
- 4.1 向量存储
- 4.2 应用检索
5 附录
- 5.1 整体代码
- 5.2 参考附录

Ollama是建立在llama.cpp开源推理引擎基础上的大模型推理工具框架，Ollama能够在包括CPU、GPU在内的不同的硬件环境上，运行各种精度的GGUF格式大模型。
可以通过执行一个ollama run命令来运行Hugging Face上4.5万多个GGUF格式大模型，另外也可以直接加载运行ModelScope模型库上的GGUF模型。

GGUF(Georgl Gerganovs Universal Format)是一种专门为大型语言模型(LLM)设计的文件格式，由llama.cpp项目开发。这种格式的主要目标是提高模型的推理速度和优化内存占用，以适应资源受限的设备上部署大型语言模型的需求，它代表了对之前GGML(Georgl Gerganovs Machine Learning)格式的重要升级。

vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架，旨在极大地提升实时场景下的语言模型服务的吞吐与内存使用效率。vLLM是一个快速且易于使用的库，用于LLM推理和服务，可以和HuggingFace无缝集成。

1 langchain

要求python版本3.9及以上。
大型语言模型（LLM）正在成为一种变革性技术，使开发人员能够构建他们以前无法构建的应用程序。然而，孤立地使用这些 LLM 通常不足以创建一个真正强大的应用程序 —— 真正的力量来自于您可以将它们与其他计算或知识来源相结合。该库旨在

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

皮皮冰燃 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。