ChatGPT流式显示单词的技术实现

码届小王

已于 2024-08-01 21:08:01 修改

阅读量1.2k

点赞数 16

分类专栏： AI学习笔记文章标签： chatgpt spring http

于 2024-07-31 14:19:58 首次发布

本文链接：https://blog.youkuaiyun.com/qq_26843937/article/details/140819730

版权

問題：怎麼做出這種效果

1. 前端

OpenAI 的 ChatGPT API 使用的是基于 HTTP/2 的协议来支持流式传输功能。HTTP/2 允许在单个连接上多路复用多个数据流，这使得流式传输成为可能。具体来说，OpenAI 的 API 可以通过 HTTP/2 的长连接进行流式数据传输，从而实现逐步接收和处理数据，而不是等待整个响应完成。

流式传输的工作原理

当你启用 stream=True 选项时，OpenAI 的 API 会逐步返回生成的内容。这种方式允许客户端在数据生成时立即处理，而不需要等待整个响应完成。这在处理大规模数据（如多个段落的文本或长对话）时特别有用，因为它可以显著减少延迟并提高用户体验。

流式传输的实现细节

客户端请求：客户端发送一个带有 stream=True 参数的请求。
服务器响应：服务器通过一个持续打开的 HTTP/2 连接逐步发送数据块（chunk）。
客户端处理：客户端逐块接收数据并处理，可以实时显示或进一步处理这些数据。

示例代码

以下是一个使用 Python 和 OpenAI API 的流式传输示例：

import openai  
   
# 初始化 OpenAI 客户端  
openai.api_key = 'your-api-key'  
   
# 发送请求并启用流式传输  
response = openai.Completion.create(  
    model="gpt-3.5-turbo",  
    prompt="Tell me a story.",  
    max_tokens=100,  
    stream=True  
)  
   
# 逐块处理响应  
for chunk in response:  
    if chunk.choices[0].delta.content is not None:  
        print(chunk.choices[0].delta.content, end='', flush=True)

优点

实时性：客户端可以立即处理和显示部分响应，而无需等待整个响应完成。
高效性：减少了内存占用和延迟，提高了数据处理的效率。
用户体验：用户可以更快地看到结果，尤其是在处理大规模数据时。

结论

OpenAI 的 ChatGPT API 使用 HTTP/2 协议来支持流式传输功能，使得客户端可以逐步接收和处理数据。这种方式不仅提高了实时性和效率，还显著改善了用户体验。

2. 后端如何实现HTTP/2的stream=True

在 Spring Boot 中处理 HTTP/2 和流式传输，可以利用 Spring WebFlux，它是一个用于构建反应式应用程序的框架。通过使用 Flux 对象，你可以逐步发送数据给前端，从而实现流式传输的效果。

下面是一个简单的示例，展示如何设置一个 Spring Boot 服务端来处理 HTTP/2 和流式传输，并逐步返回内容给前端。

1. 创建 Spring Boot 项目

你可以使用 Spring Initializr 创建一个新的 Spring Boot 项目，选择 Reactive Web 依赖项。

2. 配置 HTTP/2

确保你的 Spring Boot 项目配置了 HTTP/2。在 application.properties 中添加以下配置：

server.http2.enabled=true

3. 创建控制器

创建一个控制器，使用 Flux 对象来逐步返回数据。

示例控制器

package com.example.demo;  
   
import org.springframework.http.MediaType;  
import org.springframew

最低0.47元/天解锁文章