企业生成式AI的趋势应用与前沿发展
企业语义搜索项目实践
在企业应用中,语义搜索是一项极具价值的技术。为了模拟知识库,我们使用一篇关于坐骨神经痛替代疗法的论文(可在https://doi.org/10.1136/bmj - 2022 - 070730找到),并借助LangChain模块进行嵌入和问答管理。
文档嵌入操作步骤 :
1. 初始化嵌入模型以对自定义文档进行向量化。使用LangChain的OpenAIEmbeddings模块,它可直接封装Azure OpenAI的嵌入模型。代码如下:
from langchain.embeddings import OpenAIEmbeddings
from langchain.chat_models import AzureOpenAI
from langchain.vectorstores.faiss import FAISS
from pypdf import PdfReader
from langchain.document_loaders import PyPDFLoader
embeddings = OpenAIEmbeddings(document_model_name="text - embedding - ada - 002")
embeddings.embed_query('this is a test')
运行上述代码后,会得到一个数值向量,这是使用text - embedding - ada - 002嵌入模型计算得出的。
超级会员免费看
订阅专栏 解锁全文
1751

被折叠的 条评论
为什么被折叠?



