创新、标准化与商业成功

创新、标准化与媒体信号处理的商业成功

杉山明彦 雅虎日本公司
芹泽正浩 日本电气株式会社

摘要

本文探讨了媒体信号处理领域的创新、标准化与商业成功。首先,探索了解决客户问题的良好解决方案,这是发明的关键。通过洞察真实且有前景的客户需求,从发明发展出创新。文章结合实例讨论了创新与标准化、创新与市场发展以及创新与商业成功之间的关系。

& WHAT是创新吗?

有两种有用的评论可以帮助理解创新1。

塞缪尔·帕尔米萨诺(IBM董事会主席):
“以新颖且独特的方式创造影响、价值和差异化,充分利用当今企业所拥有的众多能力。创新诞生于发明与洞察力的交汇之处。它是将发明应用于解决问题的过程。”

韦恩·克劳(佐治亚理工学院院长):
“创新不仅要求我们率先发现新知识和发明新技术,还要求我们率先开发新理念和新方法,将这些知识和技术应用于解决问题并创造机会。”

通常认为,创新源于发明,而发明基于知识和技术,通过洞察力解决问题并创造机会。广为人知的是,熊彼特2 ,将创新分为五种类型,涵盖了更广泛的概念。从数字对象标识符10.1109/MCE.2020.3035343出版日期 2020年11月3日;当前版本日期2021年4月13日
专题栏目:消费电子领域的创新专题栏目:消费电子领域的创新
2021年5月/6月 由IEEE消费技术学会出版 2162‐ 2248 2020 IEEE 97
授权许可使用仅限于:伦敦政治经济学院。2021年5月17日UTC时间06:16:12从IEEEXplore下载。适用限制 a pp l y .

本文档由funstory.ai的开源PDF翻译库BabelDOCv0.5.10(http://yadt.io)翻译,本仓库正在积极的建设当中,欢迎star和关注。

媒体信号处理的研究与开发角度来看,本文重点关注一种新产品。

创新包含多个步骤,其中包括发明,这些步骤常常如图1所示相互重叠。新产品通常源于客户的需求,而这些客户有时是潜在的。为了最大限度地实现商业成功,必须识别出客户真实且有前景的需求,其中包含一个问题。为了开发出更好的问题解决方案,对问题进行广泛而深入的分析是必不可少的。

创新通常源于国际标准化过程或涉及多个组织的高度竞争性开发。例如,由ISO/IEC(国际标准化组织/国际电工委员会)、ITU(国际电信联盟)、3GPP(第三代合作伙伴计划)等开展的标准化工作,以及液晶显示器(LCDs)、只读存储器(RAMs)、个人计算机(PCs)和手机终端的开发。

在标准化环境中,紧张而严格的标准制定时间表会加速核心技术的创新进程,并推动外围技术的发展。

与多个组织的合作在标准化中很常见。这主要源于技术开发的时间表紧张和资源有限。合作可以将必要的资源分配给多方,减轻每个成员的负担。应充分关注建立一个高效且互补的团队。

创新与良好营销应相辅相成。在产品/服务推出之前,应先提供用于实时演示的原型系统。发布是确保在早期市场中占据有利地位的最有用工具之一。以专利为代表的知识产权(IPRs)在创新中不容低估。侵犯他人已授予的专利可能对商业产生致命影响。在创新过程中,应充分保障专利权。

本文从标准化和商业成功的视角,结合实例介绍了媒体信号处理领域创新的若干方面。下一节讨论如何针对已识别的问题开发出更好的解决方案。

文中阐述了创新与标准化之间的关系,特别是围绕核心技术与外围技术的关系。合作有利于创新,尤其是对资源不足的情况而言。综合营销开拓市场并使其扩大。最后,一个实例表明,有许多因素有时难以识别,但对赢得商业成功至关重要。

IN SEARCH OF A BETTER SOLUTION

通常情况下,工程师并不深入参与客户需求的识别,而更多地负责开发良好解决方案。什么是良好解决方案?实际上几乎不可能找到相关文献来讨论或界定“良好解决方案”的含义,即使可能也极为困难。这显然不是一项简单的任务。不同立场对此可能会有不同的理解。我们可以一致认同的一点是,良好解决方案无法脱离对问题的看法或定义而存在。同一个问题可能有多种不同的看待方式。

丰田五问法

大野耐一,20世纪50年代丰田生产系统的缔造者,在其著作3中阐述了丰田分析问题的方法:
“丰田科学方法的基础是,每当我们发现问题时,都要问五个为什么。通过连续五次追问为什么,问题的本质及其解决方案就会变得清晰。”

当遇到问题时,通常的做法是进行分析以找出问题产生的原因。大野耐一建议,这一步骤在找到第一个原因后不应停止,而应重复五次,以确定根本原因。实际流程如图2所示。

步骤1:
以清晰简洁的方式写下具体的问题。

步骤2:
询问“为什么会出现这个问题?”并写下答案。这是第一个原因(图2中的原因1)。

步骤3:
如果刚刚提供的第一个原因不是步骤1中所写问题的根本原因,请再次询问“为什么”,并写下另一个答案。它是图2中的原因2。

步骤4:
如果在步骤3中确定的第二个原因不是该问题的根本原因,则再次询问“为什么”以确定另一个答案。它在图2中是原因3。

步骤5:
重复进行两个原因识别步骤(步骤5和步骤6),以得到图2中的原因5。这是步骤1中出现的问题的根本原因。

“五个为什么”只是一个示例,实际可能需要少于或多于五次提问。其原则是:当你连续问了五次为什么,并得到五个逐步深入的答案时,你应该能够找到问题的根源。从而让你能够解决根本原因,而不是中间或非必要的原因。还可以应用五个为什么来形成对问题的不同视角,进而得出不同的解决方案。让我们来看两个例子:音频编码和蓝光激光二极管。

同一问题的不同解决方案 ‐ 音频编码中的预回声

MPEG(运动图像专家组)在其音频标准 MPEG‐14,a中采用了一种称为自适应块大小变换编码5,6的技术,以使预回声不可闻。预回声是一种出现在起音之前的嘶嘶噪声,起音处信号功率急剧增加。值得注意的是,埃德勒7和杉山5独立提出了自适应改变块大小的相同想法。虽然埃德勒的论文发表较早,但杉山于1989年在日本提交的专利8,比他们的德国专利更早,并在多个国家获得授予。这很好地说明了关于某项创新的专利应尽早提交。

人们常说,总会有另外两个人提出同样的想法。令人印象深刻的是,后来又发现了一项关于同一想法的进一步专利申请。

示意图0

图3说明了预回声产生的机制。传统变换编码将输入信号样本分组为固定大小的块,通常为 1024、2048或4098。对每个样本块应用改进的离散余弦变换(MDCT4 ,也称为TDAC:时域混叠消除9),并将得到的MDCT系数根据每个系数确定的比特数进行量化。这就是编码过程。在解码过程中,使用编码器提供的比特分配信息作为边信息,对量化后的样本进行反量化。反量化之后是逆 MDCT过程,以恢复时域解码样本。由于比特率限定的比特数有限,在编码过程中引入的量化噪声会均匀分布在每个块的解码时域样本上,如图3(b)所示。该量化噪声远小于信号样本本身,因此被掩蔽而不可闻。当出现起音时,起音之前的样本

示意图1

其功率接近于零,且不足以掩蔽量化噪声,从而导致可听的预回声。在图3(c)中,预回声可见于起音前的P区,而在Q区由于掩蔽效应,预回声不可见且不可闻。

由于量化噪声在块内的采样点上均匀分布,相邻的块不会出现预回声。对于如图3(d)所示的短块大小(其块大小为(c)的四分之一),预回声仅在第三个块中存在,且持续时间更短。此外,起音前短暂的预回声由于时域中的预掩蔽效应10,很可能是听不见的。从图3(c)和(d)来看,短块似乎优于长块,但情况并非如此简单。边信息是随着量化后的样本逐块传输的。这意味着图3(d)中的短块传输边信息的频率是(c)的四倍,导致每秒边信息的总大小也变为四倍。因此,主要信息(即量化后的音频样本)会减少,解码后的音频质量也会下降。长块大小在边信息传输方面更高效,但在起音处出现预回声时的音频质量不如短块大小;反之亦然。总之,在块大小选择上存在边信息传输效率与解码后音频信号质量之间的权衡。

这种权衡通过根据是否存在起音来自适应地改变块大小来缓解,如图4所示。只要在指定的长块中不存在起音,就会采用最高效的长块大小,因为此时不会出现预回声问题。相反,当存在起音时,则选择预定的短块大小,以保证足够的音频质量和相对降低的效率。长块的大小设计为短块大小的整数倍。此处所述的自适应块大小MDCT(改进离散余弦变换)技术,正是用于在MPEG‐1及后续的 MPEG音频标准中使预回声不可闻的方法。

从丰田五问法的角度来看待此示例时,问题在于预回声,而无论在哪一步所确定的原因都是块大小选择在音频质量与利用边信息进行数据压缩效率之间的权衡。值得再提出一个“为什么”,以进一步找出原因为存在起音。那么,针对这一原因的一个可能且最直接的解决方案是通过平滑处理来消除起音。同样也可以将此问题视为源信号不足

示意图2 和(b)所示,而短块用于具有起音的块,如(c)所示)

利用预攻击段的功率来掩盖量化噪声。解决此问题的自然解决方案是在预攻击静音段强调源信号11。

任一解决方案均可实现为时域中的阶梯增益,如图5(a)所示。该增益在静音段大于单位增益以进行放大,而在起音之后为单位增益,以保持相同的幅度。通过这种预加重过程,MDCT之前的信号看起来如图5(b)所示,由于阶梯增益的作用,信号幅度的分布在(b)中比在(a)中更加均匀。图5(c)显示的是在编码器中经过量化、在解码器中经过反量化和逆MDCT(IMDCT)后的信号。量化噪声在整个块中均匀分布。与图5(a)中的阶梯增益互补的反阶梯增益导致了解码信号如图(d)所示。通过去加重过程实现的互补的增益成功地压缩了编码过程中引入的量化噪声,使其不可闻。

原因 解决方案
音频质量与压缩效率之间的权衡 自适应块大小 根据来源而定 信号
存在起音 阶梯增益以使 起音平坦
预处理中功率不足 攻击部分以掩蔽 量化噪声 阶梯增益至预加重和 去加重以调整 功率

氮化镓晶体制造用于蓝光激光二极管

一个类似的例子出现在器件技术领域,而非信息技术领域。2014年诺贝尔物理学奖授予了三位开发出用于蓝光激光二极管的高质量晶体的人。其中一位获奖者是中村修二博士。他的贡献是开发了用于蓝光激光二极管氮化镓晶体大规模生产的所谓双流法。

示意图3

图6显示了在蓝宝石衬底上通过金属有机化学气相沉积(MOCVD)——也称为金属有机气相外延(MOVPE)——制备氮化镓薄膜时遇到的一个问题。在反应室中,将包含NH3 þ H2的反应气体供给基板以形成氮化镓薄膜。该方法存在的问题是所制备晶体的质量不够高。赤松等人发现反应气体未能有效输送到衬底表面,因此引入了带有倾斜衬底的长向下输送管12。该输送管成功地将反应气体(在其方法中还包含三甲基铝(TMA))输送到表面,气流以一定角度直接冲击衬底,实现高效化学

示意图4

反应。通过增加反应气体的流速,使其不会扩散。

中村等认为,反应气体的高流速会导致整个蓝宝石衬底上的氮化镓质量不均匀。他们可能认为,反应气体在撞击衬底表面后会发生散射,并且不会停留在其附近。他们的解决方案是采用一种双流 MOCVD(TF‐MOCVD)13,引入一种称为压制气体的二次气流,取代输送管,将反应气体压向平面,使其速度显著降低。图7展示了采用TF‐MOCVD的反应室结构,其中(a)和(b)分别表示概念结构和实际实现。覆盖蓝宝石衬底整个表面的漏斗形管以低速释放压制气体。可以理解的是,中村等所确定的原因是反应气体因其重量轻而产生向上运动。因此,一个直接的解决方案就是将反应气体向下压,使其接触蓝宝石表面,从而实现成功的沉积。

原因 原因 解决方案
未送达 反应气体 长输送管,倾斜的 基板,以及 反应气体
向上移动的 反应气体 向上移动的 反应气体 惰性气体用于加压 反应气体

创新与标准化

标准化往往是创新的摇篮。对于企业而言,尽管这看似矛盾,参与标准化所能获得的最大回报通常并非标准本身。当然,标准化的最终目标是使自有技术得到应用,最大化相关知识产权的专利使用费收益,并在相关商业领域享受先发优势。

示意图5

然而,这对公司来说是一场巨大的赌博,类似的例子多到不胜枚举。

标准化推动核心技术发展

有一点是确定的,即在标准化过程中进行的研发(研究与开发)投资能够有效推进核心技术的发展。这可能是因为目标和时间表都非常明确且基本不可更改。在明确的目标和严格的时间表下,人们往往能够发挥出最佳水平。日本电气株式会社见证了两个这样的例子:ISO/IEC中的MPEG音频标准以及3GPP中用于AMR(自适应多速率)编解码器的噪声抑制器。

NEC于1989年加入MPEG音频标准化工作,当时其他公司和大学已经开始了开发并提出了初步的技术方案。在此之前,他们的框架一直采用子带编码,然而,负责人突然宣布音频信号将进入变换编码时代。他并未将有经验的工程师从原有的子带编码项目调至新项目,而是指派了一位对音频编码领域较为陌生的工程师,从头开始阅读以往文献并编写变换编码的程序。为了提出新的技术方案,后来者必须在短时间内迅速赶上现有技术水平。经过连续三个月每月加班150小时的代价,最终发现了一个关于余弦变换块大小确定的问题。这种情况只有在20世纪80年代末才可能发生,因为当时法律尚未对加班时长设定正式上限。该问题通过根据输入信号特性自适应地调整余弦变换的块大小得以解决,从而在其知识产权组合中建立了稳固的立足点。

十年后,1999年,NEC参与了第三代合作伙伴计划(3GPP)噪声抑制器标准的制定。该标准TS26:077 15 ,规定了信号质量的要求以及质量评估的详细流程,而非具体的噪声抑制器算法。这是因为在标准化期间没有提案能够满足所有的技术要求。

随着3G移动电话服务即将启动,开发一种符合 TS26:077标准的噪声抑制器的任务被交给了一个刚入职的年轻工程师。获得硕士学位后加入NEC。与其他标准化不同,该标准已经确立,因此无法期待标准化时间表带来的快速技术开发。然而,对于一名对噪声抑制器一无所知、需要从零开始的新手工程师来说,情况更加艰难。在近两年的时间里,他们经历了无数次失败,最终发现噪声估计的准确性不足是导致音质差的主要原因,由此提出了加权噪声估计16,17作为解决方案。这一简单而巧妙的想法,是通过根据估计的信噪比,将包含目标语音和非目标噪声的输入信号进行分配,从而获得良好的噪声估计。这种自然且直接的估计方法在提高噪声估计准确性方面发挥了关键作用,并成为后续噪声抑制算法中的核心技术。

加权噪声估计的学术价值获得了日本电气、信息与通信工程师学会2002年最佳论文奖和2018年成就奖的认可。

除了阳光下的技术外,那些不值得发表论文或申请专利的技术也已积累成为重要资产。例如,在噪声抑制领域中,音乐噪声的降低——即减少快速变化的调制音调混合物——仍在研究中。然而,这对他们来说根本不是问题,也无需特殊技术。NEC早已建立了一种不受音乐噪声影响的标准算法。

通过其明处与暗处技术的综合积累,3GPP认可了 NEC符合3GPPTS26:077的噪声抑制器所取得的成功评估结果。这在当时是3GPP对顶级音质的认证。

参与标准化无疑会推动核心技术的发展,然而,任何事物都有其阴暗面。与不足的人力资源竞争可能会损害工程师的健康。将标准化时间表用作开发中的里程碑,可能导致工程师缺乏调度和自我管理能力。管理者应充分意识到这些问题,并妥善应对这些弊端。

标准化推动外围技术发展

参与标准化不仅推动了核心技术的发展,还促进了外围技术的进步。1978年,ITU‐T(国际电信联盟‐电信标准化部门,前身为CCITT:国际电报电话咨询委员会)正在制定下一代语音编码标准 G:,该标准基于在32千比特每秒比特率下的自适应差分脉冲编码调制(ADPCM)。NEC为此标准提出了多项提案,最终其基于预测的语音冗余去除技术被采纳。这一标准化活动推动了NEC内部语音编码技术的发展,并进一步延伸至音频编码。值得注意的是,从商业盈利的角度来看,真正对商业带来最大利益的是外围技术,而非语音编码中的核心技术。

20世纪70年代末至1980年初,通信系统由离散的加法器和乘法器或多个SSIs(小规模集成电路)/ MSIs(中规模集成电路)实现,后者是前者的单芯片集成。有限冲激响应(FIR)滤波器执行预测功能,这是自适应差分脉冲编码调制(ADPCM)中的基本功能之一。FIR滤波器具有重复执行乘加(MAC)操作的结构,即先进行乘法再进行累加。一位NEC工程师注意到这一结构,从而催生了一款专用于高效计算一系列MAC操作的可编程数字信号处理器(DSP)芯片。这便是DSP19–21的诞生。

该DSP内置片上MAC处理器,可在单个指令周期内完成数据加载、乘法、累加和存储操作。由于其可编程性(即软件控制能力),在算法日新月异、频繁修改代码至关重要的标准化过程中,这款 DSP成为了一种实用工具。

MAC运算在信号处理中是最常见的基本操作之一,常用于傅里叶变换等时频变换,更不用说有限冲激响应滤波器了。正因为如此,能够高效执行 MAC运算并具备可编程性的数字信号处理器,至今仍被公认为实现系统的最关键组件之一,以智能手机为代表的多种多媒体终端。众所周知,德州仪器公司(TI)自1990年代初专注于数字信号处理器(DSP)业务后实现了显著增长。相反,NEC并未如预期般受益。在比MPEG标准化早十年的国际电报电话咨询委员会(CCITT)标准化过程中,必要专利持有人曾达成协议,不主张收取专利使用费。因此,既没有来自专利使用费的利润,也没有从核心技术中获得其他商业成功。另一方面,NEC开发了世界上第一款数字信号处理器(DSP),并推出后续型号产品,成功建立了新的业务部门,获得了一定的先发优势。

随着数字信号处理器承担越来越复杂的处理任务,代码编写(编码)成为工程师们的难题。数字信号处理器按照用汇编语言编写的代码运行,而汇编语言是针对特定芯片的低级语言,不同于 Fortran和C语言等高级语言。编写数字信号处理器的代码需要精通汇编语言的经验丰富的工程师。然而,当时的工程师无法理解支持编码的重要性。对他们而言,使用特定芯片专用的汇编语言进行编码,就等同于使用高级语言进行编码。

因此,当DSP处理能力迅速发展且编码变得越来越复杂时,NEC工程师并未对编码支持技术或等效的代码编译器提出足够的投资需求。投资重点被放在芯片开发上,而非开发能够将高级编程语言代码转换为汇编代码以支持编码的优质代码编译器。这正是NEC在DSP商业领域迅速丧失地位的原因。

NEC在2000年代投入大量资金,试图在3G手机普及之际改变局面,开发出具有突破性计算能力和低功耗的新芯片。然而,NEC未能获得较大的市场份额,仅为其自身的手机产品做出了贡献。奇迹从未发生。

这真是一个奇怪的巧合:美国电话电报公司(AT&T,原名American Telephone and Telegraph Company)拥有AT&T贝尔电话实验室(最初名为贝尔电话实验室,后更名为AT&T贝尔电话实验室,再变为贝尔实验室创新部门,现为诺基亚贝尔实验室),却也未能将数字信号处理器发展成一项大商业。美国电话电报公司在1980年与 NEC同一次会议上发布了其开发的数字信号处理器。其芯片由子公司西电公司制造,在1984年拆分之前仅允许内部使用。德州仪器公司在商业上的成功表明,技术发展与商业成功之间的主导因素存在显著差异。正确的方向在商业中至关重要,错误的定位会立即导致迅速衰落。改变方向的时机是另一个重要因素。有时,追随者反而具有优势,因为他们没有对过去经验的误导性偏见和错误依恋。回顾历史并构建合理的解释很容易,但对于身处当下的决策者而言,确立正确的方向始终是一项持久的挑战。

除了数字信号处理器(DSP)之外,NEC还有更多由标准化推动的大规模集成电路(LSI)成功开发案例。在G.721标准制定的后期阶段,算法规范被编写为一系列公式,每个公式都精确定义了逐位操作。采用这种方法是为了避免不同制造商设备之间的不兼容性。然而,这也限制了NEC自身 DSP芯片的使用。当委员会讨论这一严格规范时,NEC即开始研发一款适用于最终规范的新DSP芯片,结果在标准正式批准仅一个月后,便推出了世界上第一款符合G.721标准的自适应差分脉冲编码调制芯片25,26。

类似的例子可以在MPEG‐1音频中找到,该标准于1992年底完成,并于1993 4年8月发布。在此发布后的两年内,市场上推出了一款用于解码 MPEG‐1或MPEG‐2音频码流的专用大规模集成电路芯片,并被用于卫星音乐广播服务以及 MPEG‐1音频系统的原型开发。这使得硅音频的第二代产品(在下一节中介绍)相比第一代更加紧凑和轻便。采用通用数字信号处理器实现的生成。这款 MPEG‐1音频解码器芯片,其显微照片如图8所示,是首批上市的芯片之一。如此快速的芯片开发得益于在标准化方面的深入参与和坚定承诺所带来的正确而详尽的知识。尽管NEC因拥有半导体部门来开发大规模集成电路芯片而具有特殊性,但如今其他公司也可以像苹果公司一样与台积电(台湾半导体制造公司)等合同制造公司合作。标准化推动了外围技术的发展。

协同创新

有时,创新跨越多个组织。大约在2000年,采用MPEG‐1音频Layer III(即MP3)和 MPEG‐2/4音频AAC的音频系统正在消费和商业市场广泛传播。这些技术已实现了足够高的音频压缩比,同时主观质量良好,可与源信号相媲美。我们许多人认为音频编码技术已经发展成熟。当时,一种新的视频编码标准正在开发中,后来被称为 H.264,又称高级视频编码。因此,人们自然对具有更高压缩比的相应音频编码标准产生了浓厚关注。

示意图6

2001年初,在MPEG会议前几天,下一代音频编码的提案征集刚刚发布,编码技术公司(CT: 2007年被杜比实验室收购)与汤姆逊多媒体宣布了一种基于频谱带复制(SBR)29的新音频编码框架。该技术通过从低频成分生成高频成分,并辅以少量边信息,实现了比传统算法高一倍的压缩比。

到2001年底,从主观质量角度来看,SBR与AAC的结合被认为是最有希望成为下一代标准的候选方案,优于其他提案。NEC是一直在寻找机会参与标准化工作的组织之一。有一天,一位NEC工程师在参加完MPEG日本国家委员会会议后,有机会与松下(现为松下)的一位工程师一起喝酒。两人观点一致,决定在标准化工作中开展合作。他们各自在公司内部都属于规模较小的团队,面临着人力资源短缺的问题。NEC在MPEG‐1和MPEG‐2方面拥有经验,而松下则在新加坡有一个小型研究小组,后来也加入了标准化工作。

为了参与标准化,有必要开发并提出一项技术来增强SBR与AAC的简单组合。他们尤其关注计算量的问题。最初的SBR与AAC组合所需的计算量超过了当时芯片所能支持的计算能力。松下和NEC在 2002年春季基于简单滤波器组成功提出了首个联合提案。最终的提案由松下、NEC以及开发基础 SBR技术并随后加入松下‐NEC联盟的CT共同合作完成,在2002年秋季成功实现了与原始SBR+ AAC相当的主观质量,同时计算量减少40%。在合作开发过程中,定期在各方所在地举行的现场讨论(称为营地会议)被证明非常有效,更不用说远程电视会议了。MPEG‐4 HE‐AAC(高效AAC)30的最终国际标准草案于2003年3月发布,随后开始了首次商业化。

2004年,音乐分发到手机终端。在资源不足时,创新中的合作有助于弥补缺失的环节。

创新与市场发展

创新完成后,必须尽快提供原型以开拓市场。NEC准备在200331年中期向潜在客户提供基于通用数字信号处理器实现的HE‐AAC原型系统。由于当时尚无明确的商业前景,该原型由研究实验室自主推进开发,未获得业务部门的支持。这种早期原型化有助于后续产品设计,加快开发进程,并提前发现原本难以察觉的实施难题。CT、松下和NEC各自独立并有时协作,在相关标准化组织、论坛以及电信运营商中开展市场营销工作。这三家公司最终于200232年末在日本及海外就低复杂度SBR发布了联合新闻发布会。

专利权是创新早期商业化和市场营销的另一个重要问题。当早期采用者显现时,专利持有者尽早建立联合许可框架,有助于市场的发展。CT、松下和NEC针对SBR技术建立的此类框架,之后加入了由专利许可机构Via Licensing管理的AAC专利池33 ,,并支持在后续专利评估中对标准必要专利进行顺利许可。

通过多个层级且耗时的内部决策来批准合同文件,常常会减缓研究合作和专利谈判的进程。事实证明,最有效的方法是亲自携带文件,逐一拜访各个有权审批的负责人进行审批。这不仅有助于更好地理解内部审批流程,还能加强人际关系。由于这些努力,SBR技术除了此前提到的在移动网络中的音乐分发应用外,还被应用于音乐流媒体到手机、单段电视广播、欧洲数字广播网络、美国卫星广播、数字多功能光盘(DVD)系统以及SD存储卡。创新开拓了新市场。

创新与商业成功

成功的创新并不一定意味着商业成功。MPEG音频的应用之一是便携式音频播放器,如今它已成为智能手机的功能之一。毫无疑问,苹果公司的iPod主导了便携式音频播放器市场,而作为其延伸版本的iPhone和iPad则推动了当今智能手机和平板个人计算机的普及。(iPod、iPhone和 iPad是苹果公司的注册商标。)然而,鲜为人知的是,世界上第一款全固态便携式音频播放器—— iPod的前身——是在日本开发的22,23。这款全固态便携式音频播放器诞生于单芯片存储器容量不断增大、价格持续下降以及数据压缩比迅速提高(或等效地,实现足够好的主观音频质量所需的数据比特率不断降低)的交汇点上24。

硅音频于1994年12月发布,是世界上第一款全固态便携式音频播放器,可读取以MPEG‐1音频第二层编码并存储在信用卡大小的闪存卡中的音频数据,对其进行解码并重放为声音。(硅音频是日本电气株式会社的注册商标。)该存储器卡容量为40 MB,比特率为每通道192千比特每秒,压缩比为四,音频回放时间为30分钟。该消息被日本的主要报纸如《朝日新闻》和《日本经济新闻》(即日经)以及海外印刷媒体如《时代周刊》、《新闻周刊》和《金融时报》等广泛报道。图9展示了硅音频的三代原型和一张信用卡大小的闪存卡。

针对这些文章,NEC内部的业务部门以及外部公司纷纷提出了许多关于可能商业计划的咨询和建议。其中最具前景的应用之一是用于如今普遍实施的“大学入学考试中心全国统一考试”的音频播放器。该播放器旨在解决外语听力考试通过扬声器播放时,考场内各个座位听到的声音清晰度不一致的问题。在向大学入学考试中心(NCUEE)进行了技术展示并使用原型播放器进行音质演示之后,下一阶段便是提出交付条件和付款条款。该计划拟采用一次性使用的播放器,以避免使用后的清洁与存储成本。令人惊讶的是,NCUEE实际设想的价格远高于NEC的预期。然而,即便如此,NEC仍无法接受该价格,因为累计成本加上几乎为零的利润已经超过了目标售价。NEC未能充分认识到这一合同在未来几年可能带来的影响:每年承诺出货五十万台、制造成本的大幅降低、来自NCUEE业务的声誉提升,以及向类似语言考试如托业考试( TOEIC)和托福考试(TOEFL)等领域的拓展。

开发这些原型的NEC工程师因未积极寻求在台湾或中国进行可能的生产,而难免被贴上对商业缺乏热情的标签。

同样重要的是要记住,当时大多数人认为硅音频还不是一个现实的产品。原型中使用的40兆字节闪存卡在当时的价格约为1500美元24。闪存 EEPROM(电可擦除可编程只读存储器)的价格为每兆字节27美元24。即使是不可擦除的掩模只读存储器,价格也达到每兆字节0.9美元。根据过去闪存EEPROM价格的推算,我们得知每兆字节的价格将降至约1美元。然而,NEC工程师们很难完全信任这种外推结果,并据此设定反映未来价格的售价。主要制造商也存在类似的犹豫;第一代支持MP3的iPod于 2001年进入市场。此外,早期的iPod型号采用的是硬盘驱动器(HDD)作为存储介质。直到2004 年,苹果公司才推出了首款全固态音频播放器 iPod nano,该产品配备了MPEG‐4音频AAC算法并上市销售。NEC工程师在1994年进行的外推,以巧妙的方式准确预测了2000年的价格水平。

硅音频是技术发展与实际商业应用之间存在时间滞后的典型例子。它表明,除了核心技术完成(本例中为音频编码算法)之外,商业成功还需要周边技术的成熟,例如片上存储容量,以及价格和环境的变化,例如便携式音频播放器的普及和从购买CD向音乐下载的转变。NEC未能把握住合适的商业时机,导致在便携式音频播放器领域获利甚微。事实上,NEC位于欧洲的子公司 Packard Bell于2003年在欧洲市场推出了一款名为AudioKey的MP3播放器,但最终以失败告终。

在固态音频播放器业务初期,著名的制造商如 Creative Technology、世韩信息系统和艾利和(前身为雷音公司)主导了市场,随后日本制造商如爱华、松下(现为松下)、索尼和东芝也相继进入。然而,在后续发展中,这些制造商却惨败于后来进入市场的苹果公司,后者凭借包含一站式内容购物服务iTunes音乐商店(现为iTunes商店。iTunes是苹果公司的注册商标)的商业模式取得了胜利。杉山和岩垂24讨论了苹果公司成功的一些其他因素,包括版权保护。这表明,单纯的等待无济于事,你还需要在商业上开发出自己的解决方案。

NEC因其音频编码算法获得了可观的专利许可费,而便携式音频播放器方面则没有获得任何许可费。实际上,在硅音频发布新闻发布会之前,已有一份专利申请草案准备就绪。然而,知识产权部门并未发现该系统——从存储器中读取编码数据以解码并回放声音——具有一丝价值。该草案被提交至技术披露期刊,该期刊发表那些无需建立专利权即可防止他人提交相同想法的发明。该草案足够详细,即使部分也能得以通过并被授予专利,因此它本可成为另一个许可费来源。人们可能会责备NEC工程师缺乏足够的热情。但当时标准化尚处于早期阶段,还未获得广泛普及和认可。同样真实的是,当时知识产权的重要性远未像今天这样被广泛认识。

结论

媒体信号处理领域的创新、标准化与商业成功已得到阐述。文章强调了基于对问题进行深入分析而提出优秀解决方案对于良好发明的重要性。通过正反示例,讨论了创新与标准化、创新与市场发展以及创新与商业成功之间的关系。本文的一个目的是帮助读者汲取经验教训,以促进未来创新并使其更加成功。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值