Miluvs 向量数据库
关于 Milvui
可以参考我的前两篇文章
- • 一篇文章带你学会向量数据库Milvus(一)[1]
- • 一篇文章带你学会向量数据库Milvus(二)[2]
下面我们安装 pymilvus
库
pip install --upgrade --quiet pymilvus
如果你使用的不是 Miluvs
数据库,那也没关系,langchain
已经给我们分装了几十种向量数据库,你选择你需要的数据库即可。本文中我们是系列教程中一篇,所以我们使用 Miluvs
向量库。
Embedding model
这里需要明确的两个功能是:
- •
embedding Model
所做中工作就是将image
、Document
、Audio
等信息向量化. - •
vectorBD
负责保存多维向量
我这里使用 AzureOpenAIEmbeddings
是个收费的模型。有开源的 embedding Model
可以部署在本地使用,如果你的机器性能足够好。如果要本地部署可以参考 docker
部署 llama2
模型 。
这里我使用 AzureOpenAIEmbeddings
, 相关配置我放到了 .env
文件中,并使用 dotenv
加载。
这里各位可以依据自己的情况设定即可。
向量化+存储
上面已经说明了向量库以及embedding model
的关系。我们直接使用 langchain
提供的工具连完成 embedding
和store
。