什么是流式输出:
流式输出是一种逐步传输数据的技术,允许服务器将数据分批发送给客户端,而不是一次性加载全部内容。
流式输出是一种逐步传输数据的技术,允许服务器将数据分批发送给客户端,而不是一次性加载全部内容。https://bbs.huaweicloud.com/blogs/449699首先构造一个用于流式输出的引擎
streaming=True:启动流式输出
similarity_top_k=3:返回语义相似度前三的结果
# 构造流式输出引擎
query_engine = index.as_query_engine(
streaming=True,
similarity_top_k=3,
llm=llm)
response_gen是一个生成器对象,它会逐个产出查询结果的文本块。
response_stream = query_engine.query("请写一篇1000字的文章论述法学专业就业前景")
for text in response_stream.response_gen:
print(text,end="")
通过fastapi做成http接口后的结果: