1、声音场景与事件计算分析:原理、应用与挑战

声音场景与事件计算分析:原理、应用与挑战

1. 动机

想象一下,你站在城市的街角,闭上眼睛,你会听到什么?也许是马路上汽车和公交车行驶的声音、人行道上人们的脚步声、人行横道的蜂鸣声、购物袋和盒子的沙沙声与碰撞声,还有购物者的交谈声。听觉能让我们在不睁眼的情况下了解周围发生的事情,无论是在厨房有人做早餐时,还是在听广播里的网球比赛。

对大多数人来说,聆听日常事件和场景的能力是自然而然的,但对计算机而言,这是一项极具挑战性的任务。创建能够自动识别声音事件的“机器聆听”算法仍是一个待解决的问题。

自动识别声音事件和场景在众多涉及声音或声音感知的应用中具有重大影响:
- 声学监测 :可识别诸如玻璃破碎、枪声或车祸等物理事件。与视频监测相比,声学监测在许多场景中更具优势,因为声音可以穿透障碍物,不受光照条件影响,且捕捉声音通常消耗的能量更少。
- 多媒体内容分析 :大量的多媒体材料(广播、社交媒体上传或个人收藏),目前的索引方法大多基于人工提供的文本描述,这些描述生成缓慢且往往不准确。自动生成多媒体项目描述的方法可以带来更准确的基于内容的搜索方式。
- 移动设备上下文感知 :智能手机、平板电脑、机器人和汽车等设备配备了麦克风,具备捕捉和分析音频信号的能力。通过音频分析,它们可以识别并对环境做出反应。例如,汽车听到拐角处孩子的叫声会减速,智能手机可以根据不同场景自动调整铃声。

科学界的近期活动,如DCASE挑战和相关研讨会(包括大量商业参与),表明人们对声音场景和事件分析技术的兴趣日益增长。

2. 什么是声音

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值