汇报人:王竟择
日期:2025-04-01
本周工作总结:
项目组之前进行了开题答辩,我深度参与了基于老师反馈的技术方案调整和原型设计。针对要求完善会议管理功能和新增实时AI问答,我协助修订了技术方案,新增会议创建、结束、日历提醒和实时问答模块,更新了功能需求文档,补充约2000字内容,详细定义了实时AI助手的检索逻辑(基于历史会议内容的向量搜索,Faiss索引)和数据可视化功能(会议场次、时长统计,ECharts实现)。

我与韩林琦使用墨刀设计了项目原型,完成了7个核心页面(会议日历、实时问答界面、会议管理仪表板、数据统计等)的UI交互设计,输出10页交互流程图和5个高保真页面原型,涵盖了用户登录、会议创建和实时交互场景。

我更新了系统架构,删除了视频处理模块,优化了多模态数据处理流程,设计了白板和图片数据存储方案(MongoDB存储白板元数据,MinIO存储图片文件),绘制了新架构图(数据预处理、模型调用、前端展示三层)。在数据准备上,我下载了AliMeeting语料库10小时训练集数据(212场会议中的20场),提取语音、文本和元数据,转换为JSON格式,共500MB,适配模型输入。我测试了DeepSeek和讯飞ASR接口,编写150行Python代码实现批量音频处理,处理了5段会议音频(每段10分钟),语音转文本准确率达88%。我测试了DeepSeek和腾讯ASR模型,编写200行Python代码实现多线程音频处理,处理10段会议音频(每段15分钟),语音转文本准确率达90%。

我还学习了SpringBoot,搭建了后端项目框架,完成了用户登录接口(JWT认证),支持基础CRUD操作。

焦于原型设计和开发环境搭建,完成了技术学习和初步实现。我使用墨刀优化了项目原型,完善了会议管理(创建、编辑、通知)、日历提醒和实时问答模块的UI交互,更新了7个核心页面,输出了15页交互流程图和8个高保真页面(包括用户仪表板、会议详情页),生成前端页面设计文档(附件:前端页面设计.pdf,约20页)。在前端开发上,我深入学习了VUE,搭建了前端项目环境,基于Element Plus组件库实现了3个页面(登录、会议列表、日历),编写约200行JavaScript代码,支持动态渲染会议数据。



被折叠的 条评论
为什么被折叠?



