个人周报-山大公历第16周

一、工作目标与背景

以往系统按“一场会议 = 一条记录”进行问答检索,难以支持用户对细节片段的深度追问。本周目标是将会议语音 逐句转录 → 数据库持久化 → 自动摘要 → 对话注入,让 AI 能基于完整上下文提供实时、细颗粒度答复,彻底摆脱“按场会议”粒度的限制。

二、主要完成任务

1. 会议转录实时入库

  • 新建 transcript_lines 表,字段:id、meeting_id、speaker、text、timestamp

  • 前端 WebSocket 实时推送转录,后端批量 insert,句级延迟 ≤500 ms。

2. 系统级 Prompt 生成会议摘要

  • 会议结束触发 Cloud Task,调用 deepseek-chat 定制 Prompt,自动汇总所有发言要点。

  • 摘要写入 meeting_summary 表(summary_id、meeting_id、content、generated_at)。

3. 摘要注入会话

  • 后端在生成摘要后,将其包装为系统问答对:

  • 通过 /sessions/update 写入对应会话,isSummary:true 用于前端高亮。

4. 细颗粒度问答

  • 检索顺序:transcript_lines(句级召回)→ meeting_summary(段级补充)。

  • 对话接口新增 history_all 参数,将当前会议全部发言与摘要串联,AI 可跨句、跨议题即时回答,实现“实时会议内容问答”。

三、遇到的问题与解决办法

  • 识别与同步机制不匹配:updateSessionMessages 里只靠 m.content.includes('会议总结') 来判断,但实际返回的纯文本 summary 并不包含该关键词,导致根本不同步到后端。

  • 缺少对 summary 消息的显式标记:没给生成的会议总结消息打任何 flag,无法在同步逻辑中区分它与普通的 AI 回复。

  • 会话创建逻辑与消息清空耦合:createNewSession 不仅生成新的 sessionId,还会重置 messages.value,导致刚生成的总结被覆盖。

  • sessionId 未持久化导致重复建会话:在调用 summarizeMeeting 时如果 sessionId.value 还是 null,就会重新创建会话;之后发问又因同样原因再建一次,看起来像“断开重连”。

  • 同步函数缺少对系统 summary 的独立分支:原先的同步逻辑只关注“用户问→AI 答”这样的对话对,对单独的系统生成总结没有专门处理,导致 summary 消息漏写。

四、下周工作计划

        1. 实现会议内RAG

        2. 会议内图像识别

本周成果:完成“转录-摘要-注入-细粒度问答”全链路,实现了可随时引用整场发言的实时 AI 问答,为多会议跨维度知识挖掘奠定数据基础。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值