异步调用openai接口，流式响应

Qiming_v

已于 2024-08-29 22:29:21 修改

阅读量873

点赞数 6

文章标签： openai

于 2024-08-29 22:27:37 首次发布

本文链接：https://blog.youkuaiyun.com/zhilaizhiwang/article/details/141689822

版权

服务端

import json
import uvicorn
from openai import AsyncOpenAI
from fastapi import FastAPI, Request,responses

client = AsyncOpenAI(
    api_key="",
    base_url="https://open.bigmodel.cn/api/paas/v4/"
) 
MODEL = "glm-4-flash"
app = FastAPI()

@app.route("/stream")
async def stream_endpoint(request: Request):
    async def response_stream():
        completion = client.chat.completions.create(
            model=MODEL,
            messages=[
                {"role": "system", "content": "你是一个聪明且富有创造力的小说作家"},
                {"role": "user", "content": "请你作为童话故事大王，写一篇短篇童话故事。"}
            ],
            top_p=0.7,
            temperature=0.9,
            stream=True
        )
        partition = []
        async for chunk in await completion:
            partition.append(chunk.choices[0].delta.content)
            # 每次生成器产生数据时，发送到客户端
            # yield json.dumps(chunk.model_dump(), ensure_ascii=False) + "\n"
            yield ''.join(partition) + "\n"
 
    return responses.StreamingResponse(response_stream())

if __name__ == "__main__":
    uvicorn.run(app, host="0.0.0.0", port=8000)

调用方法

import requests
with requests.get('http://localhost:8000/stream', stream=True) as r:
    for line in r.iter_lines():
        if line:
            decoded_line = line.decode('utf-8')
            print(decoded_line)