IBM公司公布语音识别软件源代码

IBM将向Apache软件基金会提供语音软件源代码,方便网页开发人员创建语音网页程序,还计划向Eclipse基金会提供语音标记编辑器。不过,Linux桌面开发人员认为其对Linux桌面应用作用不大,且软件价格昂贵,Linux用户使用受限,也可选择未开发出最终产品的开源软件Sphinx。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

蓝色巨人IBM公司正在向开源组织Apache和Eclipse基金会提供其语音软件的源代码程序。但遗憾的是,用户必须购买一套IBM的语音识别系统才能享受这一好处。

  IBM公司将向开源组织公布各种运行时间和工具集代码,以便开发人员更加方便地给网页程序添加语音识别功能。该公司在本月初表示,将向提供许多源代码软件项目的组织——Apache 软件基金会(Apache Software Foundation)提供语音软件的源代码程序,此举是让网页开发人员可以更加容易地创建语音网页程序。

  公司也正计划向开放源软件开发平台Eclipse基金会提供语音标记编辑器,以便有利于开发人员编写标准语音程序。

  Eclipse基金会执行董事Mike Milinkovich周五向本社透露,标记编辑器将作为Eclipse插件集成到其它工具中。他说,增加语音程序的数目将不仅可以方便残疾人使用计算机,同时也将改变人类与计算机系统的互动方式。

  Milinkovich说道“声音是人与计算机互动的更好方式。易使用性是它的重要特征,由衷希望能够普及语音程序。”

  Linux桌面开发人员Olaf Schmidt透露,IBM公布的源代码有利于开发Web应用程序,但对于Linux桌面应用程序作用不大。Schmidt还指出,依赖于语音识别应用程序的残疾人将必须购买并安装IBM的ViaVoice或其他语音识别软件。否则,IBM所提供的源代码将失去作用。

  自由标准组织易用性工作小组的负责人JaninaSajka在一次访谈中指出,IBM语音软件的昂贵价格将使用户对该项应用程序望而却步,尤其是对那些没有工作的残疾人更是如此。

  Schmidt称,目前针对于Linux平台而开发的易用性软件的确很多,但还没有开发对Linux切实有用的语音-文本应用程序,这是一个大问题。因此,Linux用户要想使用语音识别应用程序,必须拥有IBM的ViaVoice软件及其授权许可。

  语音识别软件对不能使用双手来进行操作的用户非常有用,比如一些多发性硬化患者。Schmidt说到,“一些多发性硬化患者可以使用一个指头,并且只需敲入一个字符来使用计算机。

  IBM公司的ViaVoice语音识别软件是2000年6月向Linux系统开放的,但是后来又从市场取消其开放。IBM的雇员Aaron Leventhal在8月份举办的KDE会议表示,ViaVoice的语音文本文件将允许Linux通过使用WizzardSoftware获得。他向使用开发源浏览器Mozilla的开发人员做了类似赠送报告。

  据Wizzard网页介绍,由于其本身并不包括语音识别组件,因此Linux用户要是使用该系统,首先必须在Windows系统下开发出自己的应用程序,然后才能在Linux系统上进行编辑。

  IBM没有对此问题发表评论。 

  此外,对于需要使用语音识别软件的Linux用户来说,另一项选择是使用Sphinx,这是一个开放源语音识别软件。但是根据Sphinx的网站信息显示,到目前为止,公司目前尚未开发出最终的产品,而Schmidt也没有意识到要使用这一软件。


出处:http://www.zdnet.com.cn/developer/
【内容描述】 全套视频会议平台,并包含类似qq的点对点即时通讯系统,视频语音,电子白板,远程控制等强大功能。可提供全部源代码。详细功能描述如下: 视频会议特性:多点输入输出,每个客户端最大可支持4通道输入(音视频同步)。每个输入通道可以被其他客户端选择性的接收。每个客户端最大可支持4个屏幕输出,可以将多个输出屏幕组合成电视墙来使用。视频会议系统同即时通讯系统高度集成。通过即时通讯系统,可以很方便的邀请好友加入到视频会议中。 云台支持:支持各类主流云台,可以远程控制云台运动。 虚拟会议中心:单个服务器支持多个虚拟视频会议。所有的会议都可以进行,彼此之间相互独立互不干扰。 会议模式和权限控制:视频会议系统拥有多种会议模式和多级权限控制,使得会议控制更加安全可靠。参加会议的用户有三种身份:主持人、与会者和旁听者。主持人拥有全部的操作权限,同时负责会议的管理工作。与会者拥有指定操作的权限,该指定权限可以预先设置,也可以由主持人随时动态调整。旁听者没有任何操作权限。与会者可以请求发言,一旦成为发言者,该与会者即拥有全部的操作权限。会议模式包含自由发言模式和受控模式。在受控模式下,与会者的发言请求需要主持人的批准;在自由发言模式下,与会者的发言请求不需要主持人的批准而立刻被允许。会议允许多个用户拥有主持人身份,他们可以同时协同操作,使得会议的管理工作更加容易。 高质量的视音频,系统支持多种类型的视频和音频输入。视频输入设备支持标准的Windows摄像头和专业的视频采集卡。系统支持多种视频大小和编码方式。视频尺寸支持从160X120到720X576。视频编码支持XVID和H264。系统支持多种音频编码方式,最高音质可与CD相媲美。音频和视频参数可以随时动态调整。主持人用户还可以远程调整其他用户的视音频参数,以帮助对系统不熟悉的用户。屏幕和应用程序共享实时共享文件、图片、网页、多媒体文件甚至整个桌面。轻松解决了会议中不同用户身处不同的地方的合作性困难,大大增强了视频会议系统的可用性,并确保其达到最佳的交互效果。 电子白板*使用矢量位图的格式,您可以保存、导入、粘贴位图或文本文件。提供多种的二维绘图模型:线、矩形、三角形、圆形、椭圆等,提供多种三维模型:圆锥、圆柱及立方体等。仅仅通过鼠标操作,你就可以任意缩放、旋转其中的任何图形模型。白板操作即时被传送到所有会议用户,所有会议用户的白板将同步显示相同内容。系统支持电子白板的录制和回放。 会议字幕*会议字幕将在所有会议用户的屏幕下方滚动显示。 文字聊天*系统支持所有会议用户之间的文字聊天。*系统支持两个会议用户之间私下的文字聊天,不会对会议其他用户产生干扰。 丰富的显示模板*系统支持多种显示模板选择。*系统图像支持任意拖放。*系统独有画中画显示功能,可以重点突出被选择的视频图像。 录像和回放*系统支持将会议的全部音频、视频以及数据操作录制在一个文件中,回放的时候可以真实再现当时会议场景。*系统支持在会议中回放预先录制的文件。 高效的传输算法*通过独立自主研发的传输算法,系统可以适应从56K拨号上网到光纤等各类IP网络。传输以保证实时性为最高目标,在保证实时性的前提下尽量获取最大传输带宽,这样可以最大程度的保障会议的效果。良好的扩展性*为满足大系统的容量要求,视频会议支持多MCU级联实现。 即时通讯主要特性: 音视频*可以根据网络带宽情况调整音视频参数,以获得最佳效果。*可以远程调整其他用户的视音频参数,以帮助对系统不熟悉的用户。 电子白板*使用矢量位图的格式,您可以保存、导入、粘贴位图或文本文件。提供多种的二维绘图模型:线、矩形、三角形、圆形、椭圆等,提供多种三维模型:圆锥、圆柱及立方体等。仅仅通过鼠标操作,你就可以任意缩放、旋转其中的任何图形模型。白板操作即时被传送到所有会议用户,所有会议用户的白板将同步显示相同内容。系统支持电子白板的录制和回放。多方视频*你可以邀请多个用户加入到同一个视频对话中来组建一个快速的小型视频会议。屏幕和应用程序共享*实时共享文件、图片、网页、多媒体文件甚至整个桌面。轻松解决了会议中不同用户身处不同的地方的合作性困难。文件传输*你可以传输任何文件至任意用户。 网络文件柜*你可以上传文件至服务器并且可以被授权用户下载。发布公告*你可以对你所属部门的全体用户发布公告通知。与视频会议相集成*与视频会议系统相集成。通过即时通讯系统,你可以邀请其他用户加入到视频会议中来。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值