
说话人日志
文章平均质量分 87
主要更新说话人日志中的各类知识与研究
柳安忆
AI领域萌新。方向大体是语音/图像算法与端侧推理。
欢迎交流~
展开
-
【说话人日志】快速跑通项目实战—3D-Speaker说话人分离
快速跑通项目实战—3D-Speaker说话人分离原创 2025-03-27 11:07:50 · 1298 阅读 · 0 评论 -
基阵理论基础——常见阵列与均匀线列阵(UniformLinearArray,ULA)
常见阵列与均匀线列阵(UniformLinearArray,ULA)原创 2025-02-26 22:03:20 · 1544 阅读 · 0 评论 -
【说话人日志】说话人日志实验指标 日志错误率(DER)、Jaccard错误率(JER)和拼接最小排列词错误率(cpWER)是什么
说话人日志实验指标 日志错误率(DER)、Jaccard错误率(JER)和拼接最小排列词错误率(cpWER)是什么原创 2025-02-25 09:47:37 · 900 阅读 · 0 评论 -
【说话人日志】《3D-Speaker-Toolkit: An Open-Source Toolkit forMultimodal Speaker》阿里通义多模态说话人开源项目3D-Speaker
该项目由阿里通义团队开源,提供解决“谁在何时说话纯音频说话人日志:由多个模块组成,包括重叠检测(可选)、语音活动检测、语音分段、说话人特征提取和说话人聚类。多模态说话人日志:融合音频和视频图像输入以生成更精确的结果。项目github链接视频介绍论文地址我们介绍了3D-Speaker-Toolkit,一个开源的多模态说话人验证和日志工具包,旨在满足学术研究者和工业从业者的需求。3D-Speaker-Toolkit巧妙地结合了音频、语义和视觉数据的优势,无缝融合这些模态以提供强大的说话人识别能力。原创 2025-02-23 13:34:47 · 1214 阅读 · 0 评论 -
【说话人日志】说话人日志(分割)综述与研究进展
说话人日志(分割)综述与研究进展原创 2025-02-24 09:38:28 · 1568 阅读 · 0 评论 -
【说话人分离】多说话人分离基础知识—鸡尾酒会问题
本文介绍了多说话人分离的基础知识—鸡尾酒会效应原创 2025-02-20 16:03:12 · 461 阅读 · 0 评论