在vista下使用语音合成,语音识别体会(一)

vista下使用语音合成,语音识别体会(一)

一个很难得的机会,我能够在vista下开发语音合成和语音识别.也对vista下的语音识别和语音合成的技术有了些了解.在这里为自己总结一下.也希望这一个总结可以帮助将要涉及到这方面开发的朋友们少走一些弯路.

因为本来就不想写成学术性的文章,所以也没有太多讲究,白话文 now begin ->

语音合成 以下简称 TTS

语音识别 以下简称 SR

TTS的合成技术我在使用vista在前也有用到过,但是合成出来的中文语音实在是比较差强人意。用大白话来形容:“就跟数蹦豆似的”。而且也几乎听不出来语调。

vista推出的过程中,我有幸的拿到了vista 的测试版(RC1),并开始了在vista上开发了语音程序。当我听过了vista上的中文语言包[lili] 的语音合成输出。我觉得比以往我听过的任何的一个语音合成的声音都要棒,当然在语音合成方面IBM也有着其独到的方面,我也有使用过IBM的语音合成技术,但是在这里我可以很负责任,也很公平的说:微软在 vista 上的中文语音合成的确要更好一些,在语音语调的处理上更人性化一些。

TTSlili语音包是打包在了vista 的系统当中的 ,而且在 vista的系统当中具有一个叫做“讲述人”这样的工具

<shapetype id="_x0000_t75" stroked="f" filled="f" path="m@4@5l@4@11@9@11@9@5xe" o:preferrelative="t" o:spt="75" coordsize="21600,21600"><stroke joinstyle="miter"></stroke><formulas><f eqn="if lineDrawn pixelLineWidth 0"></f><f eqn="sum @0 1 0"></f><f eqn="sum 0 0 @1"></f><f eqn="prod @2 1 2"></f><f eqn="prod @3 21600 pixelWidth"></f><f eqn="prod @3 21600 pixelHeight"></f><f eqn="sum @0 0 1"></f><f eqn="prod @6 1 2"></f><f eqn="prod @7 21600 pixelWidth"></f><f eqn="sum @8 21600 0"></f><f eqn="prod @7 21600 pixelHeight"></f><f eqn="sum @10 21600 0"></f></formulas><path o:connecttype="rect" gradientshapeok="t" o:extrusionok="f"></path><lock aspectratio="t" v:ext="edit"></lock></shapetype><shape id="_x0000_i1025" style="WIDTH: 262.5pt; HEIGHT: 241.5pt" type="#_x0000_t75"><imagedata o:title="" src="file:///C:%5CUsers%5Cscorpio%5CAppData%5CLocal%5CTemp%5Cmsohtml1%5C01%5Cclip_image001.png"></imagedata></shape>

它是一个描述您在使用操作系统上的各种的操作。包括对操作系统窗口的描述,用户的鼠标操作动作,我们也可以使用讲述人来实现如下的功能:

  • 选择讲述人高声阅读的文本

  • 启动后最小化讲述人

  • 更改讲述人声音

  • 讲述人问题的疑难解答

在我使用的过程中,感觉它从性能上和语音合成所达到的高度,都是很让人惊喜的,希望大家也可以有机会尝试一下。

在这里我介绍一下它的一部分命令按键,让我们粗略的了解下它的功能:

使用此键盘快捷方式

功能

Ctrl+Shift+Enter

获取当前项目的信息

Ctrl+Shift+空格键

阅读整个选定的窗口

Ctrl+Alt+空格键

阅读选定窗口的布局

Alt+Home

获取当前项目的信息

Alt+End

获取当前项目的摘要

Insert+Shift+G

阅读当前选定元素中独立元素的描述

Insert+Ctrl+G

阅读与当前选定元素相邻的非独立元素的描述

Insert+Ctrl+Home

进入虚拟菜单导航模式,使用该模式可以访问讲述人命令,而无须切换当前正在使用的程序

Ctrl

使讲述人停止阅读文本

Insert+Q

将文本选择移动到前一个文本模式的起始位置

Insert+W

将文本选择移动到下一个文本模式的起始位置

Insert+E

将文本选择移动到当前文本模式的起始位置

Insert+R

将文本选择移动到当前文本模式的结束位置

Insert+F2

选择使用当前文本模式的所有文本

Insert+F3

阅读当前字符

Insert+F4

阅读当前字词

Insert+F5

阅读当前行

Insert+F6

阅读当前段落

Insert+F7

阅读当前页

Insert+F8

阅读当前文档

今天就先写到这里 明天的时候我们一起来看更为奇妙的 vista 上的语音合成

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值