llm chat场景下的数据同步

原创

已于 2024-12-12 20:10:18 修改 · 586 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#架构

于 2024-12-12 19:46:42 首次发布

背景

正常的chat/im通常是有单点登录或者利用类似广播的机制做多设备间内容同步的。而且由于长连接的存在，数据同步（想起来）相对简单。而llm的chat在缺失这两个机制的情况下，没见到特别好的做到了数据同步的产品。
llm chat主要两个特点：1. chat的输出过程是耗时的，并不是正常chat的完整回复；2. 业务形态不适合跨轮长连接。

原则和场景

llm的对话历史由于会直接影响模型的下一轮推理，同时用户在流式过程中的操作和模型输出的结果会有明显时间差。故形成一个简单原则：前端无错误时以前端为准，用户看到的必须和模型看到的一致。
场景上会有两大部分：1. 前端操作，对需要对模型输出进行覆盖；2. 后端数据比前端要新，需要择机同步给前端。这部分又有几种情况：a. 多点登录的情况下，另一个设备有新聊天；b. 推理被触发，但前端没有收到数据，随后恢复。恢复可能是流中和流结束后。

解决

整体话术遵循该DDD的定义。
整体上可以认为是redis主从模式的变种，本文的数据同步已经上线，方案可以直接拿来抄，问题不大。
总体上，redis的runid与对话的thread_id对等，offset与入库时间戳对等。广义的循环不变式是数据和时间戳一一对应，前后端均根据时间戳计算出diff，相互传递数据做更新。