自 1998 年首次发布以来,蓝牙技术可以说已经发展成为历史上最成功的双向无线标准。 在无线标准业务中,成功通常计为每年售出的芯片数量。在此基础上,蓝牙是赢家,2023 年的芯片出货量约为 45 亿颗。Wi-Fi 紧随其后,达到 42 亿,其次是 GSM 和 3GPP 电话 的所有变体的 18.4 亿,DECT 的 Wi-Fi 仅为 1.45 亿。
然而,在其历史的大部分时间里,实际上只有一小部分蓝牙芯片被使用。当蓝牙技术首次 提出时,其开发人员确定了四个主要用例。其中 3 个是音频应用程序,专注于简单的电话功能:
-
一个简单的无线耳机,只是您手机的一个扩展,定义在耳机配置文件中
-
用于家庭和 企业的内部通信规范
-
一种用于无线电话的新技术,希望取代美国使用的专有模拟标准和欧洲新兴的 DECT 标准。其目的是将无绳网络和蜂窝网络的功能结合在一部手机中。
第四个用例称为拨号网络或 DUN,它提供了一种将笔记本电脑连接到 GSM 电话的方法,将电话用作调制解调器,无论您身在何处,都可以访问互联网。与新技术标准经常出现的情 况一样,尽管 PC 和手机公司最初有一些热情,但这四个用例都没有真正起飞。无绳电话 和对讲机失败了,因为它们可能会夺走移动电话运营商的收入。拨号网络很有效,但当时 移动电话的数据资费很昂贵,这鼓励人们改用新的 Wi-Fi 标准。耳机开始销售,但除非你 是出租车司机,否则你不太可能买耳机。很明显,这些特定的用例可能不是会在市场上产生规模的用例,因此 Bluetooth SIG 开始研究许多其他功能,例如打印和对象传输,但这 些功能都没有引起消费者的更多兴趣。接下来发生的事情是所有标准机构所希望的 - 政府法规的出现为蓝牙技术提供了更好的存在理由。
在 1990 年代末,随着电话和电话合同价格的下降,全球移动电话的使用量呈爆炸式增长,它们从商业工具变成了消费者必需品。移动电话运营商开始成为 High Street 品牌,并发展成为重要的全球企业。
随着手机使用量的增加,人们对手机使用地点的担忧也随之增加,因为越来越多的道路事故报告称,司机一直拿着手机,导致分心。世界各地的立法者开始提议禁止开车时使用手机。对于电话行业和移动运营商来说,这都是一场潜在的灾难。据报道,在美国,近三分之一的移动订阅收入(当时基于电话的数量和时长)来自开车时拨打的电话。这是该行业不能失去的金蛋。为了节省这笔收入,他们向立法者提出了一个妥协方案,即如果司机不需要拿着手机,就可以恢复安全;相反,可以使用免提解决方案接听电话,该解决方案可以内置于汽车本身中,也可以使用蓝牙无线耳机。
这就是蓝牙技术所需的动力。随着新的安全法规的生效,手机制造商开始将蓝牙用于越来越多的手机型号,而不仅仅是高端型号。汽车行业开始将蓝牙技术集成到汽车中,并与Bluetooth SIG 合作为该用例开发了 HandsFree 配置文件。这是蓝牙技术的转折点。2003年,只有大约 10% 的手机售出了包含蓝牙芯片的手机——几乎所有手机都是高端手机。第二年,它翻了一番。这个数字每年都在增长,如图 1.2 所示。到 2008 年,三分之二的新手机都包含蓝牙芯片。
这些芯片中很少有真正用于预期目的。这是显而易见的,因为同年只售出了大约 1400 万台耳机,而且这个数字在接下来的几年里并没有显着增长。但这是“搭便车”的开始,2005 年蓝牙芯片出货量达到 2.5 亿。这些数量带来了竞争和制造效率,压低了价格,并开启了一个良性循环,至少在硬件方面,添加蓝牙技术的增量成本可以忽略不计。挑战在于找到一个足够引人注目的应用程序,以鼓励大量用户使用它。
早在 1998 年,也就是蓝牙技术宣布的那一年,我们今天所知道的音乐流媒体服务,如Spotify 和 Apple Music,还有十年的时间。具有讽刺意味的是,基于订阅的音乐流媒体并不是一个未知的概念——它已经有一个多世纪的历史了。早在 1881 年,一些电话网络就提供了一项服务,允许您远程收听现场歌剧和音乐会。但这个概念已经被一个组织得更好的行业模式所取代。蜡盘和唱片形式的物理媒体的到来,您可以随时购买和收听,扼杀了最初的实时流媒体概念。在发现他们可以拥有艺术家之后,唱片业在接下来的一百年里尽其所能收紧世界各地的版权法,以保护他们对我们听音乐方式的束缚。这将证明这是一个长期的统治地位。1998 年,我们仍然以实体唱片的形式购买我们的音乐。LP 几乎完全被 CD 取代,但我们当年购买的所有录制音乐中约有 20% 仍然是磁带。然后情况发生了变化,这在很大程度上要归功于弗劳恩霍夫研究所Integrated Circuits (IIS) 的 Alpha Gan S 公司和一家名为 Napster 的加利福尼亚小型初创公司。
Fraunhofer IIS 隶属于更广泛的研究组织,也是开发音频编解码器的卓越中心,音频编解码器是一种压缩音频文件的软件,使其足够小,可以无线传输或存储为数字文件。1993年,他们为国际 MPEG-1 视频压缩标准开发了一种新的音频编解码器。与其他音频编码方案(例如用于 CD 的方案)相比,它特别有效,并很快成为通过 Internet 传输的音频文件的标准。它被称为 MP3。如果没有它,我们将不得不等待更长的时间才能下载音乐。
因此,2000 年代初期成为 MP3 播放器和免费、可下载音乐的时代。Napster 于 1999 年崭露头角,并创造了唱片音乐行业在其百年历史中面临的第一次真正颠覆。他们立即将Napster 告上法庭,指控其侵犯版权,并试图起诉下载音乐的个人用户。消费者用手指投票,反复点击下载按钮以获得更多音乐。第一次,您可以随时随地收听的音乐可以免费获得。到 2000 年,就在它上市一年后,它的大多数用户在他们的 PC 上下载的歌曲可能比他们拥有的实体专辑还要多。然而,事实证明,唱片公司拥有更好的律师,而 Napster 输了——最初免费制作音乐的尝试失败了。虽然淘汰 Napster 的战斗一直在法庭上拖延,但下一阶段的竞争已经以 Apple 的 iTunes 的形式到来。它不是免费的,但易于使用且合法。订阅者蜂拥而至。六个月后,随着第一代 iPod 的推出,这一切变得更加容易。
大多数从事蓝牙技术工作的工程师很可能是 Napster 和 iTunes 的订阅者,尤其是他们在参加标准会议的长途航班上可以听一些东西。当法院决定 Napster 的命运时,以高级音频分发配置文件(更广为人知的是 A2DP)的形式将音乐流添加到蓝牙的工作已经在进行中。
尽管它的绰号远非易懂,但它后来成为所有蓝牙配置文件规范中最成功的,并巩固了蓝牙技术作为无线音频标准的地位。
A2DP 及其支持规范于 2006 年被采用。像诺基亚这样一直积极参与其开发的公司预计它会立即获得成功,但事实证明它的发展速度很慢。消费者没有看到购买昂贵的无线耳机的好处,大多数人使用每部手机随附的免费有线耳塞,尽管它们的音频质量通常有限。令业界惊讶的是,最初的增长不是来自耳机,而是来自蓝牙扬声器。那个新的移动音乐市场是一个你带着音乐去玩的市场,但不一定会在你播放的时候播放它是移动的。它很快就受到建筑商和水管工的欢迎,就像 Napster 在学生和蓝牙工程师中一样受欢迎。随着电视开始包含 A2DP,移动扬声器逐渐发展成为条形音箱,但耳机市场仍然非常抵制增长,直到一项新服务出现——Spotify。
Spotify(及其美国前身 Pandora)引入了一种新的商业模式。只要您接受广告,您就可以再次免费听音乐。如果您不想中断,那很好 - 您可以通过支付订阅来摆脱它们。它通过产生收入来支付许可费,巧妙地解决了版权问题,无论用户是采用订阅还是广告支持的路线。它有效地复制了 Napster 所做的,但找到了一种合法的方法。Spotify 的推出恰逢第一代 iPhone,消费者开始意识到智能手机不会主要用于打电话。相反,他们将一生中的大部分时间都花在做其他事情上,尤其是当他们的出现恰逢提供无限数据使用的负担得起的移动数据计划的出现时。移动运营商很快就将 Spotify 与他们的电话合同捆绑在一起,用户也注册了。最重要的是,它易于使用。iTunes 仍然是一项服务,您可以在其中购买下载并必须决定播放它。使用 Spotify,您只需按一下按钮,音乐就会出现。它可以是你自己的播放列表;音乐博主、最喜欢的 DJ 或算法的 THE ANALYTICS 的定义。它的最大吸引力在于它是无摩擦的——你按下一个按钮,音乐就会从你的耳塞中传出,直到你停止它。您不再需要拿着手机;您可以将口袋或包放在里面,这使其成为移动中聆听的理想选择。当您不需要拿着手机时,耳塞线就会变得很麻烦。这是用户需要的推动来说服他们开始购买蓝牙耳机。品牌蓝牙耳机的销量开始上升,因为制造商看到客户剪断了电缆。到 2016年,蓝牙耳机的销量已超过有线耳机。
图 1.4 显示了 Spotify 体验对推动这一变化的帮助。自 2006 年 Spotify 和 A2DP 规范独立出现在市场上以来的十年里,蓝牙耳机的增长几乎与 Spotify 用户的增长完全一样。
无线耳机芯片销量的增长推动了创新。到 2010 年,蓝牙芯片公司每年的芯片出货量超过15 亿颗,并正在寻找更多方法使其产品脱颖而出。新的蓝牙 LE 标准刚刚推出,但直到2011 年底它才出现在 iPhone 4s 中,几年后新一代腕带才开始使用它。在此期间,Cambridge Silicon Radio(CSR,后来被 Qualcomm 收购)已成为蓝牙音频设备芯片的领先者,并正在研究如何扩展蓝牙音频配置文件的功能。
他们为什么要这样做呢?他们看到的问题是,两个主要的蓝牙音频标准都是为非常具体的用例编写的,而这些用例并没有预见到未来。这样做的结果是他们的行为非常不同。HFP专注于低延迟、双向、单声道语音传输,而 A2DP 支持将高质量的音乐流式传输到单个设备,没有返回音频路径。这两个配置文件都不容易扩展,这限制了您可以使用它们执行的作。CSR 试图突破无线音频的界限。他们已经成功地开发了一种比蓝牙规范规定的 SBC 编解码器更高效的编解码器,并将他们自己的增强型 AptX 编解码器添加到他们的芯片中。
现在,他们决定进一步前进,看看他们是否能找到一种方法,允许使用 A2DP 规范将立体声流式传输到两个独立的耳塞。这具有重要的商业优势,因为耳塞制造商需要购买两倍的蓝牙芯片——每只耳朵一个。
他们的努力取得了成功,并开启了蓝牙音频的新时代,这将导致大规模增长。消费者对无线耳塞的接受意味着蓝牙技术与 Spotify 的增长脱钩,并获得了自己的新动力。CSR 的创新是开发一种方法,让单个耳塞接收 A2DP 流,并将立体声流的一个通道与计时信息一起转发到第二个耳塞。使用计时信息,第一个耳塞可以延迟渲染其音频通道,直到它知道第二个耳塞已收到其音频数据并准备好渲染其流。就用户而言,似乎每个耳塞都在接收自己的左声道或右声道。正如我们稍后将看到的那样,让它工作起来并不那么简单,但它会改变游戏规则。
利用这项新创新的先行者并不是大公司。2014 年初,欧洲的两家公司——瑞典的 Earin和德国的 Bragi 通过立体声无线耳塞的众筹活动拉开了序幕。Earin 的产品是一对无线耳塞,它使用新的芯片组来突破可以完成的界限。然而,真正引起人们想象力的是 Bragi 的Dash。2014 年春天,他们打破了 Kickstarter 迄今为止最成功的众筹活动的Kickstarter 记录,为他们的 Dash 无线耳塞筹集了超过 330 万美元。这是一项了不起的工程设计,它承诺将您能想到的几乎所有功能都塞进一副耳塞中。它提高了你可以用耳朵里的东西做什么的标准,开辟了一个全新的市场领域,为此我创造了“耳戴式设备”这个名字。这是一个雄心勃勃的概念,值得称赞的是,他们设法运送了 Dash。尽管拥有热情的追随者,但它表明,仅仅集成技术是不够的——你需要找到它的用途。尽管为软件开发人员提供了 SDK,但 Dash 未能在消费者中获得足够的吸引力。在接下来的两年里,其他众筹项目变得更加复杂,并成功吸引了约 5000 万美元的资金。许多人未能交付,他们开始意识到将如此数量的技术塞进一个小耳塞中是多么困难。硬件很难。这些初创公司中的大多数都半途而废,甚至 Bragi 也被迫做出艰难的决定,退出硬件领域,出售其产品系列并专注于其他主流音频产品的嵌入式作系统,它仍然是耳戴式设备设计的主要力量。
渐渐地,大公司开始涉足耳戴式设备领域,利用他们更深层次的资源来使这些困难的产品发挥作用。然后,在 2016 年 9 月,Apple 推出了 AirPods。尽管最初受到许多记者的嘲笑,但消费者喜欢它们。在短短两年内,它们成为有史以来销售最快的消费产品,自推出以来已售出近 6 亿双。其他品牌迅速效仿,中国的芯片供应商也加入了这一行列。早在2014 年,当 Bragi 和 Earin 规划市场的未来时,只有四五家硅供应商生产蓝牙音频芯片组。今天有 30 多个。新冠疫情封锁加速了销售,而销售一直保持强劲。据估计,2023 年耳塞的出货量约为 5 亿只,预计未来十年这一数字将继续增长。这些数字适用于基于经典HFP 和 A2DP 配置文件的耳塞。随着新的蓝牙 LE 音频产品开始发货,其附加功能、广播功能和增强功能电池寿命,这些数字可能会超过这些预测。
然而,无线音频不仅仅是耳塞。蓝牙音频的大部分增长是由音乐流媒体推动的,而音乐流媒体又是由 Spotify、Apple Music 和 Amazon Prime 音乐等服务的现成内容推动的。流媒体视频的到来同样受到欢迎,无线耳塞成为首选的收听设备。消费者喜欢易用性,在大多数情况下,这转化为消费内容,而不是自己生成内容,尽管像 TikTok 这样的应用程序表明,如果内容生成可以变得简单有趣,用户就会制作和分享自己的内容。
在这种演变中,语音(主要是语音通话的保留)看起来似乎正在成为一种糟糕的关系。当Amazon 推出 Alexa 时,情况发生了变化。尽管对隐私有所保留,但消费者开始与互联网交谈。从那时起,语音识别出现了复兴,以至于现在大多数家用电器都希望与我们交谈,并希望我们与它们交谈。随着蓝牙 LE Audio 支持的新功能的引入,这些应用可能会增长,本书将对此进行介绍。借助广播拓扑和确定哪些设备可以与您通信的优先级,可以添加额外的功能和新的机器语音通信机会。它可能是智能家居行业的救星。
围绕耳塞的推出,尤其是 Apple 的 Airpods 的开发速度令人惊叹。我们已经看到许多新公司开发蓝牙音频芯片,微型音频传感器和 MEMS麦克风的进步,以及提供高级音频算法以实现主动噪声消除、回声消除、空间声音和频率平衡等功能的公司数量的大幅增长。尽管免提配置文件和 A2DP 继续为我们服务,但两者都是为简单的点对点拓扑而设计的。
它们被称为蓝牙经典音频,其设计假设两个设备之间有一个连接,其中每个单独的音频数据包都得到确认。如果有两个单独的设备想要接收音频流,则不起作用。正因为如此,今天的立体声耳塞依赖于专有解决方案,这些解决方案通常涉及添加第二个无线电以在左右耳塞之间进行通信,以确保它们都在正确的时间播放音频。另一个限制是 Hands-Free Profile 不是为我们今天使用的各种蜂窝和 IP 语音电话应用程序而设计的。当用户想要从一个应用程序切换到另一个应用程序时,只有这两个独立的专用音频配置文件会导致多配置文件问题。这是在您添加并发语音出现的新要求之前控制和共享音频。
在日常生活中,我们都在更频繁地使用无线音频,无论是为了相互交谈,还是为了将自己与外界隔离开来。为了支持这种行为变化,我们需要减少对通常一起使用的单个设备(如耳机和手机)之间的连接考虑。相反,我们需要更加了解更广泛的音频生态系统,在那里,我们可能会在一天中戴在耳朵上或随身携带不同的设备,不断聆听和改变它们对其他设备的作用。为了实现无缝工作,控制需要变得更加灵活。
这就是导致蓝牙 LE Audio 开发的背景。Bluetooth SIG 意识到,他们的音频规范需要不断发展和适应,既要满足当前的需求,又要着眼于我们在音频方面所做的日益多样化的事情,以及我们可以期待在未来 20 年出现的情况。在许多用例中都出现了一些非常相似的要求。设计人员希望获得更低的功耗。不仅是为了延长电池寿命,而且是为了能够支持更多的降噪处理和其他正在出现的有趣音频算法,例如检测迎面而来的交通或相关对话。对于其他应用程序,他们希望减少延迟,尤其是对于游戏或收听实时对话或广播。此外,人们对更高的音频质量也有永无止境的追求。制定规范的
蓝牙LE Audio 工作组的任务是提出支持这些要求的新标准,以及设想的所有拓扑,而不必依赖不可互作的扩展。其目的是让该行业从今天依赖于专有实现的位置向前发展,转变为可以混合和匹配来自不同制造商的设备的位置。
1.1 助听器的贡献
许多人听到很多这种创新是由助听器行业发起的,这让许多人感到惊讶。多年来,助听器一直需要解决音频质量、延迟、电池寿命和广播传输等问题。它们平均每天佩戴 9 小时,因此电池寿命至关重要。在此期间,助听器不断放大和处理环境声音,以便佩戴者可以听到周围发生的事情和所说的话。它们通常包括多个麦克风,以允许音频处理算法识别本地音频环境并做出反应,以过滤掉分散注意力的声音。在公共场所,只要有该设施,他们可以连接到一个名为感应线圈的系统,本质上是感应线圈,该系统用于剧院、公共交通和其他公共区域,以传输音频以帮助有听力障碍的听众并提供信息。这些是广播系统,可以应对感应线圈传输区域内的数百人,或者允许使用非常小的循环进行私人对话。
助听器用户一直希望能够连接到手机和其他蓝牙设备,但传统 HFP 和 A2DP 解决方案的功耗是一个挑战。2013 年,Apple 推出了基于蓝牙 LE 规范的专有解决方案,添加可以连接到助听器中特殊蓝牙 LE 芯片的音频流。它被授权给助听器制造商,并受到消费者的赞赏,但它仅适用于 iPhone,并且是单向的。
尽管助听器行业对这一发展表示欢迎,但担心 Apple 特定的解决方案不具有包容性。他们想要一个适用于任何手机或电视的全球标准,并且还可以取代可追溯到 1950 年代的老化的感应线圈规范。2013 年,所有主要助听器公司的代表与 Bluetooth SIG 的董事会坐下来,达成了一项联合协议,提供资源来帮助开发新的低功耗蓝牙音频标准,从而为助听器生态系统带来互作性。在开发工作开始后不久,许多消费类音频公司开始关注助听器用例,并意识到它们同样适用于消费市场。尽管助听器的音频质量要求不那么严格(因为其用户有听力损失),但结合了环境音频、蓝牙音频和广播基础设施的用例比目前 HFP 和 A2DP 涵盖的用例要先进得多。它们有可能解决当前音频规范的许多已知问题和限制。
随着越来越多的公司参与进来,该项目不断扩大。经过八年的工作,Bluetooth LE Audio计划已发展成为 Bluetooth SIG 有史以来最大的规范开发项目。生成的规范涵盖了蓝牙标准的每一层,并在新的和更新的文档中包含超过 1,250 页的文本。新应用的附加规范已经非常先进。
1.2 限制和专有扩展
1.2.1 Apple 的 Made for iPhone (Mfi) 用于助听器和 ASHA
2013 年,Apple 推出了自己的专有助听器蓝牙 LE 解决方案,并将其授权给助听器制造商。它是与其中一个芯片合作伙伴共同开发的,为蓝牙 LE 协议增加了扩展,以允许在手机和一两个助听器之间单向传输数据。手机上的应用程序允许用户选择要连接的助听器,并允许他们设置音量(独立或成对)并选择各种预设,这些预设在助听器上应用预配置的设置以应对不同的声学环境。Mfi 助听器解决方案适用于 iPhone 5 手机和 iPad(第 4 代)设备以及后续产品。Mfi 支持的流行功能之一是“Live Listen”,它允许将 iPhone 或 iPad 用作远程麦克风。对于助听器佩戴者来说,这让他们可以将手机放在桌子上,以拾取和流式传输对话。远程麦克风是助听器用户的有用配件,实时收听功能无需购买额外的设备即可提供此功能。
2021 年初,Apple 宣布其用于助听设备的 Mfi 将升级为允许双向音频,带来免提功能。今年,他们还宣布他们最新的 Airpods 可以升级为低听力损失用户的助听器,并且 iOS18更新将包括听力测试。Apple 的动机并不完全是无私的。许多国家/地区的辅助功能法规迫使他们在手机中加入感应线圈,这增加了成本并限制了物理设计。他们希望监管机构能够接受蓝牙解决方案作为替代方案。监管机构不同意,因此他们的手机仍然包括感应线圈。诺基亚也有类似的愿望,并在退出手机生产之前积极支持蓝牙 LE Audio 规范的开发。
Apple 的 Mfi 听力解决方案仅适用于 iPhone 和 iPad,让 Android 用户没有解决方案。在开发蓝牙 LE Audio 的同时,Google 和助听器制造商 GN Resound 合作开发了一种名为ASHA(助听器音频流)的开放式蓝牙 LE 规范,这是一种适用于 Android 10 及更高版本的软件解决方案。它为蓝牙 LE 提供了不同的专有扩展,以支持从任何兼容的 Android 设备到 ASHA 助听器的单向流媒体。 ASHA 在蓝牙 LE Audio 开始出现在手机中之前为 Android 用户提供了一个受欢迎的填补。目前支持用于助听器的 Mfi 或 ASHA 的助听器制造商很可能会继续这样做。他们将通过添加蓝牙 LE Audio 来扩展支持,为消费者提供最广泛的选择。归根结底,它只是另一种协议,这意味着更多的固件和内存。但是,大多数新开发可能会朝着全球可互作的蓝牙LE Audio 标准发展。
1.2.2 真无线立体声
Cambridge Silicon Radio 在 2013 年左右开发了一种将立体声流传输到两个耳塞的实用解决方案。在被高通收购后,它更名为 TrueWireless,这是现在世界上大多数人用来描述立体声耳塞的短语。当竞争对手考虑如何效仿 Apple 的 Airpods 的成功时,高通为其他所有想要开发竞争耳塞的公司提供了一个可行的替代方案。True Wireless Stereo 或 TWS这个名字很快就确立并应用于几乎所有新产品,无论其中的芯片是谁。
将 A2DP 与单独的耳塞一起使用的主要障碍是它专为单点对点通信而设计。早在 2008年,蓝牙 SIG 就在其题为“多耳机使用白皮书”的白皮书中提供了有关如何将流发送到多个蓝牙 LE Audio 接收器的指导,但它避免了同步问题,假设每个音频接收器都可以自行决定何时呈现流。
对于耳塞,一旦左右流不同步,您就会感到非常不愉快的声音在脑海中移动。白皮书方法还依赖于对音频源的 A2DP 规范的修改。这是一个问题,因为这意味着没有采用它们的耳塞或扬声器将不兼容。要在市场上取得成功,需要一种适用于任何音频源的解决方案,这实际上意味着解决方案只需要在音频接收器 - 耳塞中实现。CSR 最初提出的解决方案称为重放或转发方法,如图 1.5 所示。
在连接到手机之前,两个耳塞会相互配对(可以在制造时完成)。一个设置为主设备,另一个设置为辅助设备。要接收 A2DP 流,主设备与音频源配对,显示为接收立体声流的单个设备。当音频数据包到达时,它会解码左声道和右声道,并在上图所示的示例中,将左声道直接中继到辅助耳塞。使用蓝牙技术可以做到这一点,但如果耳塞的天线很小,这可能会有问题,因为头部可以很好地吸收 2.4GHz 信号。许多公司在首次在户外测试他们的设备时发现了这一点。在室内,墙壁和天花板的反射通常会确保蓝牙信号通过。在室外,由于没有反射表面的帮助,他们可能不会。为了弥补这一点,通常会在 TWS 耳塞中添加第二个收音机,以解决因耳朵之间有大脑而引起的吸收问题。最受欢迎的选项是近场磁感应(NFMI),这是一种用于短距离音频传输的高效低功耗解决方案。其他芯片供应商已经其他芯片供应商也使用了类似的低频段重传 (LBRT) 方案,该方案在 sub-GHz 频率下运行。这是助听器开发人员十多年前解决的问题,但对于消费类耳塞行业来说却是新的。
由于主耳塞负责音频中继的计时,因此它确切地知道辅助耳塞何时会呈现它。它需要延迟其音频流的渲染才能匹配。这是中继方法的问题之一,因为中继过程和缓冲会增加音频连接的延迟。对于大多数应用程序来说,用户不太可能注意到它,尤其是因为 A2DP 延迟通常会占主导地位。中继方法也适用于 HFP,尽管在许多情况下,只有主设备用于语音返回路径。音量和内容控制,例如接听电话或暂停音乐,仍然使用音频/视频远程控制配置文件(AVRCP) 连接到主耳塞。第二个无线电(如果存在)也可用于在主设备和辅助设备之间中继用户界面和 AVRCP 控件,例如暂停、播放和音量。最近,公司开始转向嗅探方法,如图 1.6 所示
在这里,通过让两个耳塞都监听主 A2DP 流,消除了中继方法增加的延迟。只有一个耳塞(主设备)确认收到手机的音频数据。通常,辅助设备不知道在哪里可以找到音频流,也无法解码音频数据。在这种情况下,主设备提供它与该信息以及必要的同步定时一起,通过蓝牙链接或专有的 sub-GHz 链接。该链接由制造商配置,因此其他设备无法接收 A2DP 流。由于两个耳塞直接接收相同的 A2DP 流,因此这可能是一个更强大的方案,特别是如果作为纯蓝牙解决方案实现。在没有中继音频流的情况下,延迟明显更好。这两种方案都需要在耳塞中蓝牙堆栈的相当低的级别进行巧妙的扩展,因此在很大程度上是芯片供应商的领域。Apple 的成功刺激了相互竞争的芯片供应商进行创新,结果现在存在大约十几种不同的 True Wireless 方案,这些方案建立在这两种技术的变体之上,其中一些包括初级交换等附加功能,以便两个耳塞可以在一个丢失链接时改变角色。这些专有方法的问题在于它们可能会分散市场。苹果、高通和其他公司都为其解决方案申请了专利,这导致他们的竞争对手花费时间和精力来寻找如何绕过这些专利,而不是通过创新来推动市场向前发展。这也意味着几乎不可能混合使用来自两个不同制造商的耳塞,因为它们可能使用不同的 TWS 方案。对于消费类 TWS 耳塞来说,这可能不是问题,因为它们总是成对购买,但对于助听器来说,左耳和右耳可能需要不同类型的助听器。这使得将方案扩展到扬声器变得困难,因为环绕声系统通常将来自不同制造商的扬声器组合在一起。尽管专有解决方案可以在早期阶段刺激市场增长,但它们很少有助于其长期发展。这就是蓝牙 LE Audio 的用武之地。
1.2.3 共享收听和 Auracast
蓝牙 LE Audio 的主要用例之一是支持共享蓝牙 LE Audio。那可能是和朋友一起,当你在他们的手机上听歌时;与家人一起,当您看电视时,或者在更大的群体中,例如在体育酒吧中。助听器用户已经可以通过拾音线圈音频循环系统使用它,但蓝牙 LE Audio 的目标是将其作为电话、电视和公共场所的标准功能提供给所有人,提供可扩展的解决方案,从一个听众过渡到多个听众。可扩展性不仅适用于侦听器的数量,也适用于发射器的数量。Telecoil 的音频循环不能重叠,因此在安装它们的地方,它们只携带一个音频流。相比之下,多个蓝牙广播发射机可以在同一空间内相互并排工作。这可能是酒吧或健身房的多台电视;它可能是餐厅或咖啡店的不同背景音乐,也可能是电影院电影的不同语言轨道。同样,火车或机场休息室中的多人可能会与家人或朋友共享他们的个人音频流——所有这些流都是他们团队的私人直播。由于预期所有蓝牙芯片都将包含这种新的广播功能,因此它无需额外费用即可带来新的体验。
广播音频的低成本影响可能会导致音频使用方式发生一些重大变化,不仅针对个人用户,而且针对音频基础设施。简单的广播发射机应该不会比今天的蓝牙扬声器贵,允许任何场所花几十美元增加广播功能。它还使得为公共场所开发无线扬声器变得非常经济高效,无需布线。酒吧、餐厅、学校或社区礼堂只需在他们想要的地方添加扬声器,只要有电源插座即可 - 不再需要布线。这是一个比智能手机市场还要大的市场。历史表明,发展到数十亿个单位的技术需要互作性。除非多个不同制造商制造的设备协同工作,否则它们无法达到临界质量。对于新的规范和应用,这可能需要数年时间来开发。为了缩短这一时间,蓝牙 SIG 以 Auracast™ 的商标名称为广播音频应用程序的制造商和开发商开发并发布了 Auracast™ 简单发射器最佳实践指南。符合这些指南的产品可以带有 Auracast™ 标志,该标志告诉消费者这些产品及其安装场所将与他们的助听器和耳塞配合使用。我们将在第 12 章和第 14 章更详细地了解这些细节。
1.3 耳戴式设备里有什么?
本书的大部分内容都是关于蓝牙 LE 音频规范的细节,公司将利用这些规范为音频产品带来新的体验。在深入研究之前,查看典型耳塞的内部以查看其中的内容很有用,因为在了解规格时,我们将回顾不同的硬件元素。无线耳塞相对较新的到来受到芯片可用性的限制,芯片可以提供一种支持单独左右立体声流的方法。但这并不是唯一的原因。正如所有进入这个市场的原始初创公司所发现的那样,将复制体面音频所需的所有功能打包到像耳塞这样小的东西中是很困难的。事实上,这非常困难。将蓝牙技术以及支持它的任何其他传感器添加到其中,变得非常困难。只有大约 25% 的众筹耳戴式设备公司能够交付产品。即使是像 Apple 这样的公司也不得不投入近五年的开发才能推出 AirPods。他们甚至求助于设计自己的蓝牙芯片来获得使AirPods 如此成功的性能。这是只有最大的耳塞公司——苹果和华为——才有资源去做的事情。这是助听器制造商非常熟悉的故事,因为他们多年来一直在完善助听器的小型化。它们使用定制芯片来优化性能,从而使设备可以使用小型初级锌空气电池运行数天。蓝牙助听器中有许多令人惊讶的元素,如图 1.7 所示,它代表了一个相当基本的设计。它与耳塞的结构非常相似。
当您将助听器或耳塞拆碎时,大多数人遇到的第一个惊喜是其中的麦克风数量。要执行主动降噪,您需要一个麦克风监控环境声音,另一个麦克风位于耳道中。如果您想拾取用户的声音并通过蓝牙链接发送到他们的手机,通常会有一个骨传导麦克风来帮助拾取和隔离所说的声音。这是最低限度。但是,通常包含额外的麦克风来生成波束成形阵列以提高方向性。可能包括其他音频算法来检测环境类型并进一步增强用户的语音。后者很重要,因为耳塞和助听器中的麦克风并不像设计师希望的那样靠近嘴巴——它们通常位于耳后。我们即将看到新的法规生效,以测量耳道中的声级并警告用户潜在的听力损伤,这可能会导致更多的内置麦克风。好消息是,MEMS 麦克风在过去几年中取得了长足的发展,部分原因是语音助手的需求。这些创新增强了方向性和波束控制,以便它们可以在房间内跟随您。与传统麦克风结构相比,MEMS 的优势在于您可以将数字信号处理器集成到麦克风本身中,从而减小尺寸和功耗。在最新的耳戴式设备中找到四个或更多麦克风并不罕见。这些输入需要混合并调度到助听器的不同功能。
如果设备同时包含蓝牙技术和助听器接收器,则需要从它们路由适当的音频。对于向第二个耳塞发送控制信号或音频流的耳塞,这些都需要通过 sub-GHz 无线电(通常为 NFMI)进行路由,同时缓冲主信号以同步两个耳塞的渲染时间。在输出端,音频传感器变得更小,传统的开放式线圈结构受到微型平衡电枢传感器和音频阀的挑战。市场还看到了 MEMS 扬声器的出现,可提供更高的声级。而虽然它们现阶段可能更适合耳机,但该技术可能会迁移到耳塞。看看蓝牙 LE Audio 实现的新用例,这种处理可能会变得非常复杂。接收蓝牙流并允许同时传输语音命令的降噪耳塞需要在传输之前将语音组件与环境声音分离(并应用回声消除),同时抑制与传入蓝牙信号混合的环境声音。如果传入的蓝牙流是从与环境相同的来源广播的,例如当您在剧院、会议室或看电视时,则需要在保持大约 30 毫秒的整体延迟的同时完成所有这些作。这很有挑战性。
管理所有这些需要一个应用程序处理器,它控制着专门的音频处理模块。为了最大限度地减少助听器的功耗和延迟,这些通常在硬件中实现,而不是在通用的数字信号处理器(DSP) 中实现。应用处理器通常也会控制用户界面,其中命令可能来自助听器上的按钮或电容传感器,通过蓝牙接口,或者来自遥控器,可能使用蓝牙技术或专有的 subGHz 无线电链接。大多数设备都包含一个光学传感器,用于检测何时将其从耳朵中取出,以便将其置于睡眠状态。最后,还有电池和电源管理功能。许多助听器仍然使用锌空气电池,这比可充电电池提供更好的功率密度。这提供了两个主要优势——电池寿命更长,而且重量更轻。如果您整天佩戴助听器,重量很重要,这就是为什么大多数现代助听器的重量不到 2 克——大约是 AirPods 重量的一半。
那还只是电子设备。将所有这些安装到耳塞或助听器中是一个更大的挑战,它突破了柔性电路和多层封装的极限。设计师需要让它舒适,确保它不会从您的耳朵中掉出来,但也要在完成所有这些工作时保持良好的听觉路径,这样无论是贴合度还是装入其中的电子设备都不会影响声音的质量。您还需要考虑助听器是否遮挡的问题,即它是否阻塞您的耳朵以阻止环境声音,或者是否张开以让您同时听到两者。直到最近,人们还认为,如果您想有效地消除环境噪声,遮挡是必要的,但最近的一些创新表明,情况可能已不再如此。完全堵塞耳道会导致湿度积聚的问题,尤其是长时间佩戴时,因此我们可能会看到更多采用开放方向的设计。
这一切都不容易,这也是助听器仍然昂贵的原因之一。然而,越来越多的芯片公司正在提供参考设计,这些设计已经完成了大部分工作。再加上与专业咨询公司合作的合作伙伴计划,提供设计专业知识以缩短上市时间,这导致消费类耳塞市场以惊人的速度增长。但我们仍处于开始,为您提供可以放在你的耳朵里。
迄今为止已推出的最雄心勃勃的耳戴式设备是 Bragi 的 Dash。除了提供真正的无线立体声外,他们还决定添加一个内部 MP3 播放器和闪存,让您可以在外出跑步或在健身房时将手机留在家中,但仍然能够直接从耳塞收听您存储的音乐。
Bragi 认识到耳朵是大多数生理传感器在身体上的最佳位置,因此为 Dash 配备了大量的传感器和功能:总共九个自由度的运动传感,带有加速度计、磁力计和陀螺仪、温度计、心率监测器和脉搏血氧仪。他们制作了一个非常漂亮的图形,显示了所有元素及其相对大小,如图 1.8 所示。这是一项了不起的成就,但遗憾的是,这超出了当时市场的预期。正如健身腕带制造商所发现的那样,让客户与他们的健康数据保持互动非常困难。与音乐不同,音乐只是吞噬别人的内容,健康数据需要大量的分析才能将其转化为引人入胜的用户故事。
这是第 22 条军规,如图 1.9 所示。您需要捕获大量数据,然后才能获得足够的数据来转化为有价值的数据。在此期间,您需要聘请一些非常昂贵的数据科学家来尝试开发一些引人注目的反馈,支付云存储和分析的持续成本,以及您支持的每个新版本的手机作系统的应用程序更新。无法保证这将提供足以吸引用户支付每月订阅以支持持续开发成本的反馈。但是,如果没有这种洞察力,用户将放弃使用该产品,这就是为什么现在有这么多健身手环坐在卧室抽屉的后面。它没有制造这些设备的公司很少具有数据分析业务背景,而不是纯粹的硬件商业模式,这无济于事。一般来说,他们的背景是向您销售产品,期望他们从销售中获利,除了一小部分保修退货外,没有其他费用。相比之下,服务模型期望很大一部分用户为持续的反馈支付定期费用。很少有公司能够做到这一点,除了在非常小众的应用程序中。这仍然是许多人渴望的东西,但事实证明很难实现。
开发洞察商业模式的难点在于,迄今为止已售出的十多亿款耳塞中,几乎所有耳塞都集中在一件事上——播放内容,用户可以选择多种成熟的服务。我怀疑我们迟早会看到传感器回归耳戴式设备,因为耳朵是可穿戴设备测量生物特征的最佳场所。它很稳定,不会移动太多,靠近血流,是测量核心的良好场所温度。就可穿戴健康传感器的位置而言,这是您想要的一切,这与手腕不同,手腕恰恰相反,缺乏这些属性。然而,手腕是当今大多数健康传感器的目标位置,因为它更容易。在耳塞中安装额外的传感器仍然是一个重大挑战,这纯粹是因为空间。
许多早期进入者已经吸取了数据困难的教训,这意味着健康传感器通常作为次要功能添加,从而使拥有分析资源的公司有时间开发令人信服的反馈。这就是我们看到 Apple 对Apple Watch 所做的。这是一项漫长而缓慢的业务,只有当我们开始看到真正的健康益处出现时,它才会转向以健康为主导的业务。幸运的是,对于耳塞来说,消费者已经有一个令人信服的理由购买它们,这意味着只要用户同意,耳戴式设备就可以成为尝试其他事物的有用平台。
所有这些都转化为市场上的巨大兴奋。耳塞是有史以来增长最快的消费产品,而且发展速度没有放缓的迹象。在本书的其余部分,我们将了解蓝牙 LE Audio 如何增加兴奋度并提高该速度的增长。