清华大学成立听觉智能研究中心，要解决可解释和鲁棒性问题

最新推荐文章于 2025-04-19 13:36:20 发布

转载最新推荐文章于 2025-04-19 13:36:20 发布 · 331 阅读

·

0

·

清华大学人工智能研究院成立听觉智能研究中心，旨在揭示人类听觉机制，建立计算理论，研发声音理解技术，解决鲁棒性问题，推动AI教育，与多所高校及企业合作。

郭一璞发自清华
量子位报道 | 公众号 QbitAI

640?wx_fmt=jpeg

今天，清华大学人工智能研究院听觉智能研究中心成立了。

听觉和语音一直是AI领域研究和应用的重点，中国科学院院士、清华大学人工智能研究院院长张钹认为，在后深度学习时代，听觉智能应该成为AI领域重要的分支。

听觉智能中心研究什么？

清华大学郑方教授担任研究中心主任，他在现场介绍，听觉智能研究中心集中于三个目标：

1、揭示人类听觉的感知和认知机制；
2、建立听觉智能的计算理论与方法；
3、提出计算机感知与声音理解的技术和算法。

聚焦于可解释性、鲁棒性、安全+智能三个问题，研究中心的研发方向包括：

1、声学场景的感知与理解；
2、语音中内容、声纹、情感等多元属性信息的识别与理解，不仅要识别说了什么，还要根据声纹识别出声音的主人，说话者的情绪；
3、听觉计算的鲁棒性，保证相关应用稳定；
4、人机语音智能交互，和机器说人话，智能音箱就是这方面离我们最近的应用。

研究中心将以核心技术为基础，产出产品和服务、形成知识产权、参与标准制定。

另外，研究中心还会进行多学科的交叉，与包括剑桥大学、佐治亚理工学院、中国人民大学、天津大学、新疆大学等在内的国内外多所高校进行合作；与微软、得意音通、联动优势、浦发银行、广电运通金融等企业进行校企合作。

张钹：为什么需要听觉智能研究中心？

640?wx_fmt=jpeg

中国科学院院士、清华大学人工智能研究院院长张钹介绍，听觉本来不是AI独立的领域，在AI兴起之前也有很长的历史，在人机交互、感知等方面和AI有很大交集。

进入深度学习时代后，深度学习完全改变了听觉处理的现状，使其真正走向实用，有商业产品，这归功于统计学习、深度学习。

现在，我们进入后深度学习时代，语音处理等领域面临同样的问题：用深度学习建造的AI系统包括听觉系统都非常脆弱，容易受攻击，容易出错，在语音识别方面也非常明显，在安静条件下可以达到很高识别率，在有干扰的情况下就遇到了很大问题。

清华大学解决了声纹处理的鲁棒性问题，但是随着攻击方式变化，如果用概率统计方法来做，漏洞依然存在。

因此，在后深度学习时代，听觉智能应该成为AI领域重要的分支。

听觉智能研究中心需要建立一个可解释的AI方法为核心，与产业融合，与其他学科融合，突破AI发展中的很多问题。

另外，在AI教育方面，张钹院士认为，AI本科培养主要还是靠计算机专业，AI是计算机科学技术的分支。需要重点加强的是研究生、高端人才的培养。另外，中低端AI人才也需要培养，但清华大学主要培养高端的AI发展骨干，希望听觉智能研究中心的成立能让AI人才培养推进一步。

— 完 —

订阅AI内参，获取AI行业资讯

640?wx_fmt=jpeg

加入社群

量子位AI社群开始招募啦，量子位社群分：AI讨论群、AI+行业群、AI技术群；

欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“微信群”，获取入群方式。（技术群与AI+行业群需经过审核，审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。