个人周报--山大公历第11周

一、工作背景与目标
因为线上会议系统在高并发场景下仍缺少“实时字幕”关键体验,所以本周的核心任务是把语音转写功能完整嵌入到前端,完成一个实时的语音转录,为后续会议内的AI助手提供可分析文本,并且修复用户反馈最集中的“结束会议无响应”问题,从而提升会议可用性与易用性。

二、主要工作
本周的开发可以拆解为两条并行链:功能接入链稳定性修复链

1. 先说接入链——我们通过 Web Speech API 新建 recognition 实例,并且因为浏览器只允许在用户交互后启动,所以把 startTranscription() 嵌入麦克风开启流程;又因为需要拿到中间结果,所以把 continuous=trueinterimResults=true 同时打开。这样做之后,系统能够在用户说话尚未停顿时就把 partial 文本实时渲染,而一旦 isFinal 触发,又能无缝追加到 final 文本流中。其次,为了让字幕在任何底色画面上都保持可读性,我们把浮窗的背景改为 rgba(0,0,0,0.75),并且显式设置 color:#fff,同时保留五分之一透明度,既不会遮挡视频,也能保证白字对比度。最后,为防止首次转写为空字符串导致 v-if 阻断渲染,我们改用 v-show 并加入双字段判空条件,从而保证浮窗稳定挂载。


2. 再看修复链——“结束会议”之所以失效,是因为 use-event.js 在第 199 行调用 emit('hangup') 时拿到的并不是函数。根因是组件侧既没有 defineEmits(),也没有把返回的 emit 注入到 useEvent。我先在顶层声明 const emit = defineEmits(['hangup']),接着把它随同 pcMap 等参数一起传给 useEvent,并且在 hangup() 内部显式追加 emit('hangup'),这样既能通知父组件路由退出,也能让后端广播的挂断事件在本端正确处理。随着这三行补齐,控制台的 TypeError: emit is not a function 消失,挂断流程顺畅执行,会议状态能即时回收。顺带修正了 :id="im_${item.uuid}" 少反引号的模板错误,避免未来再触发难以定位的 DOM 异常。

最终效果:挂断后跳转回会议信息页面,可以退出或重新入会。

3. 最后,修复“关闭麦克风”后浏览器仍在转写问题

  • 浏览器为 Web Speech API(SpeechRecognition)单独打开一次麦克风硬件;与此同时,你自己用 getUserMedia 采集的麦克风轨道只服务于 WebRTC 发送。

  • 因为这两次采集彼此独立,“关闭麦克风”只会停掉 WebRTC 里的那条 AudioTrack,并不会触碰 SpeechRecognition 的采集流程。结果就是:

    • 对方听不到声音(轨道没了);

    • 但本地转写仍在继续(SpeechRecognition 仍持有麦克风句柄)

解决方案:静音同时关闭语音转写。

function handleCloseMicro () {
-  closeMicro();
+  stopTranscription();       // ← 新增:同步停掉 SpeechRecognition
+  closeMicro();              // 原有逻辑
   …                           // 后续移除 Track 的代码保持不变
}

“麦克风按钮”真正成为 统一的主开关
关闭 ⇒ 既不发送音频,也不转写;
打开 ⇒ 同时恢复音频发送与实时转写。

三、解决的关键问题与效果
虽然改动行数不多,但因为并且覆盖了“从新功能引入到稳定性保障”的完整链路,所以收益显著。具体而言:

  • 过去只有本地录制回放才能查看内容;现在所有与会者都能实时看到字幕,因为字幕浮窗默认固定在右下角,所以不再需要分屏对照;

  • 过去用户挂断时偶发白屏或卡在房间;现在无论是自己点击、还是对端触发,都能立刻回到首页并断开 WebRTC 连接,后台资源占用回到初始状态;

  • 对齐麦克风和转录线程,由麦克风开关统一控制

  • 这个实时字幕的实现为我们后期AI助手在会议中根据正在进行会议的内容进行回答的基础。

内容概要:本文是一篇关于使用RandLANet模型对SensatUrban数据集进行点云语义分割的实战教程,系统介绍了从环境搭建、数据准备、模型训练与测试到精度评估的完整流程。文章详细说明了在Ubuntu系统下配置TensorFlow 2.2、CUDA及cuDNN等深度学习环境的方法,并指导用户下载和预处理SensatUrban数据集。随后,逐步讲解RandLANet代码的获取与运行方式,包括训练、测试命令的执行与参数含义,以及如何监控训练过程中的关键指标。最后,教程涵盖测试结果分析、向官方平台提交结果、解读评估报告及可视化效果等内容,并针对常见问题提供解决方案。; 适合人群:具备一定深度学习基础,熟悉Python编程和深度学习框架,从事计算机视觉或三维点云相关研究的学生、研究人员及工程师;适合希望动手实践点云语义分割项目的初学者与进阶者。; 使用场景及目标:①掌握RandLANet网络结构及其在点云语义分割任务中的应用;②学会完整部署一个点云分割项目,包括数据处理、模型训练、测试与性能评估;③为参与相关竞赛或科研项目提供技术支撑。; 阅读建议:建议读者结合提供的代码链接和密码访问完整资料,在本地或云端环境中边操作边学习,重点关注数据格式要求与训练参数设置,遇到问题时参考“常见问题与解决技巧”部分及时排查。
内容概要:本文详细介绍了三相异步电机SVPWM-DTC(空间矢量脉宽调制-直接转矩控制)的Simulink仿真实现方法,结合DTC响应快与SVPWM谐波小的优点,构建高性能电机控制系统。文章系统阐述了控制原理,包括定子磁链观测、转矩与磁链误差滞环比较、扇区判断及电压矢量选择,并通过SVPWM技术生成固定频率PWM信号,提升系统稳态性能。同时提供了完整的Simulink建模流程,涵盖电机本体、磁链观测器、误差比较、矢量选择、SVPWM调制、逆变器驱动等模块的搭建与参数设置,给出了仿真调试要点与预期结果,如电流正弦性、转矩响应快、磁链轨迹趋圆等,并提出了模型优化与扩展方向,如改进观测器、自适应滞环、弱磁控制和转速闭环等。; 适合人群:电气工程、自动化及相关专业本科生、研究生,从事电机控制算法开发的工程师,具备一定MATLAB/Simulink和电机控制理论基础的技术人员。; 使用场景及目标:①掌握SVPWM-DTC控制策略的核心原理与实现方式;②在Simulink中独立完成三相异步电机高性能控制系统的建模与仿真;③通过仿真验证控制算法有效性,为实际工程应用提供设计依据。; 阅读建议:学习过程中应结合文中提供的电机参数和模块配置逐步搭建模型,重点关注磁链观测、矢量选择表和SVPWM调制的实现细节,仿真时注意滞环宽度与开关频率的调试,建议配合MATLAB官方工具箱文档进行参数校准与结果分析。
已经博主授权,源码转载自 https://pan.quark.cn/s/bf1e0d5b9490 本文重点阐述了Vue2.0多Tab切换组件的封装实践,详细说明了通过封装Tab切换组件达成多Tab切换功能,从而满足日常应用需求。 知识点1:Vue2.0多Tab切换组件的封装* 借助封装Tab切换组件,达成多Tab切换功能* 支持tab切换、tab定位、tab自动化仿React多Tab实现知识点2:TabItems组件的应用* 在index.vue文件中应用TabItems组件,借助name属性设定tab的标题* 通过:isContTab属性来设定tab的内容* 能够采用子组件作为tab的内容知识点3:TabItems组件的样式* 借助index.less文件来设定TabItems组件的样式* 设定tab的标题样式、背景色彩、边框样式等* 使用animation达成tab的切换动画知识点4:Vue2.0多Tab切换组件的构建* 借助运用Vue2.0框架,达成多Tab切换组件的封装* 使用Vue2.0的组件化理念,达成TabItems组件的封装* 通过运用Vue2.0的指令和绑定机制,达成tab的切换功能知识点5:Vue2.0多Tab切换组件的优势* 达成多Tab切换功能,满足日常应用需求* 支持tab切换、tab定位、tab自动化仿React多Tab实现* 能够满足多样的业务需求,具备良好的扩展性知识点6:Vue2.0多Tab切换组件的应用场景* 能够应用于多样的业务场景,例如:管理系统、电商平台、社交媒体等* 能够满足不同的业务需求,例如:多Tab切换、数据展示、交互式操作等* 能够与其它Vue2.0组件结合运用,达成复杂的业务逻辑Vue2.0多Tab切换组件的封装实例提供了...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值