langchain V2.0 一些代码块收录

人多势众

于 2024-11-03 13:52:37 发布

阅读量242

点赞数 2

文章标签： langchain python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_38694958/article/details/143464608

版权

1.加载本地ollama模型：

#pip install langchain==0.2.16
#pip install langchain_community==0.2.16
#加载本地大模型代码快
from langchain_community.llms import Ollama
model = Ollama(model="qwen1_5-4b-chat-q2_k")

2.加载并配置pg向量数据库：

#pip install -qU langchain-postgres -i https://pypi.tuna.tsinghua.edu.cn/simple
from langchain_postgres import PGVector
from langchain_postgres.vectorstores import PGVector

CONNECTION_STRING = "postgresql+psycopg2://postgres:qaz142434@192.168.159.130:5432/postgres"

# 矢量存储名
COLLECTION_NAME = "state_of_the_union_test"
# 建立索引库
vector = PGVector.from_documents(
    embedding=embeddings,
    documents=docs,
    collection_name=COLLECTION_NAME,
    connection=CONNECTION_STRING,
    use_jsonb=True,
    pre_delete_collection=True,
)

3.切分网络资源为数据块：

import bs4


import os
#解决WebBaseLoader 报错 （USER_AGENT environment variable not set, consider setting it to identify your requests）
os.environ['USER_AGENT'] = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
from langchain_community.document_loaders import WebBaseLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter

# 切分网络资源为数据块.
loader = WebBaseLoader(
    web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),
    bs_kwargs=dict(
        parse_only=bs4.SoupStrainer(
            class_=("post-content", "post-title", "post-header")
        )
    ),
)
document = loader.load()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
docs = text_splitter.split_documents(document)

4.加载嵌入ollama模型:

#pip install langchain_ollama -i https://pypi.tuna.tsinghua.edu.cn/simple
from langchain_ollama import OllamaEmbeddings
embeddings = OllamaEmbeddings(model="lrs33/bce-embedding-base_v1",base_url="http://localhost:11434/")

5.输出暂时搁置之后会以评论形式贴上流式输出代码：

博客等级

码龄8年

33
原创

118
点赞

120
收藏

108
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 题引”AI真正带来了什么”

下一篇：: RGA DEMO 上部

最新评论

向量数据库：PGVector 为AI知识库做准备
人多势众: 后续连接着我的RAG DEMO 上下部
向量数据库：PGVector 为AI知识库做准备
人多势众: 补充一下postgresql配置环境变量： vim /etc/profile（末尾添加就行） export PATH=/www/server/pgsql/bin:$PATH export PGHOME=/www/server/pgsql export PGDATA=/www/server/pgsql/data/ export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$PGHOME/lib/ export PATH=$PGHOME/bin:$PATH:$HOME/bin #使配置生效 source /etc/profile
langchain V2.0 一些代码块收录
人多势众: 流式输出代码（后期代码会不但跟进，最后会以UI呈现希望能坚持到从0开始到完成）： # 生成输出解析器 from langchain_core.output_parsers import StrOutputParser output_parser = StrOutputParser() # 将检索索引器和输入内容（问题）生成检索 from langchain_core.runnables import RunnableParallel, RunnablePassthrough setup_and_retrieval = RunnableParallel( {"context": retriever, "question": RunnablePassthrough()} ) def format_docs(docs): return "\n\n".join(doc.page_content for doc in docs) rag_chain = ( {"context": retriever | format_docs, "question": RunnablePassthrough()} | prompt | model | StrOutputParser() ) for chunk in rag_chain.stream("java 共有多少种设计模式"): print(chunk, end="", flush=True)
vue 开发
优快云-Ada助手: Vue入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/vue?utm_source=AI_act_vue
java pdf 模板多页数据导出
凹凸路: 每次生成的pdf只有一条数据

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。