Swift语音和文本的转换

最新推荐文章于 2025-09-10 16:28:46 发布

原创

最新推荐文章于 2025-09-10 16:28:46 发布 · 3.4k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#swift

TextAndVoice

Swift语音和文本的转换

相关博客

简书地址: http://www.jianshu.com/p/aa4b44e192fd

优快云地址: http://blog.youkuaiyun.com/ShmilyCoder/article/details/78872486

GitHub地址: https://github.com/CoderTitan/TextAndVoice

文本转语音是iOS7以后的技术, 用到的是AVFoundation框架
语音转文本是iOS10以后, 苹果发布的一个Speech框架
下面先介绍一下简单的文本转语音
GitHub上Demo地址
项目包括
- 文本转语音
- 实时语音转文本
- 本地语音转文本
- 录音保存本地,转文本

一. 文本转语音

文本转语音技术, 简称TTS (是Text To Speech的缩写), 语音合成苹果官方文档
是苹果iOS7以后新增的功能, 使用AVFoundation 库
下面介绍一下需要用到的类

1. `AVSpeechSynthesizer`: 语音合成器

1-1. 属性

//是否正在语音播放
open var isSpeaking: Bool { get }

//是否停止语音播放
open var isPaused: Bool { get }

1-2. 方法

//播放语音
open func speak(_ utterance: AVSpeechUtterance)

//停止语音播放
open func stopSpeaking(at boundary: AVSpeechBoundary) -> Bool

//暂停语音播放
open func pauseSpeaking(at boundary: AVSpeechBoundary) -> Bool

//继续语音播放
open func continueSpeaking() -> Bool

//(iOS10以上, 输出通道)
open var outputChannels: [AVAudioSessionChannelDescription]?

2. AVSpeechBoundary

描述语音可能被暂停或停止的枚举值

case immediate
//表示发言应该暂停或立即停止。

case word
//说完整个词语之后再暂停或者停止

3. AVSpeechUtterance

可以将文本和成一段语音的类, 或者说就是一段要播放的语音

3-1. 属性

//使用的声音
open var voice: AVSpeechSynthesisVoice?

//文本属性    
open var speechString: String { get }

//富文本属性
@available(iOS 10.0, *)
open var attributedSpeechString: NSAttributedString { get }

//说话的速度    
open var rate: Float 
//提供了两个语速 AVSpeechUtteranceMinimumSpeechRate和 AVSpeechUtteranceMaximumSpeechRate和AVSpeechUtteranceDefaultSpeechRate

//说话的基线音高, [0.5 - 2] Default = 1   
open var pitchMultiplier: Float 

//说话音量, [0-1] Default = 1
open var volume: Float 

//开始一段语音之前等待的时间
open var preUtteranceDelay: TimeInterval 

//语音合成器在当前语音结束之后处理下一个排队的语音之前需要等待的时间, 默认0.0 
open var postUtteranceDelay: TimeInterval

3-2. 初始化方法

public init(string: String)

@available(iOS 10.0, *)
public init(attributedString string: NSAttributedString)

4. AVSpeechSynthesisVoice

用于语音合成的独特声音, 主要是不同的语言和地区
所支持的所有语言种类详见最底部附录

4-1. 相关属性

//获得当前的语言
open var language: String {

最低0.47元/天解锁文章

Swift语音和文本的转换

TextAndVoice

Swift语音和文本的转换

一. 文本转语音

1. AVSpeechSynthesizer: 语音合成器

1-1. 属性

1-2. 方法

2. AVSpeechBoundary

3. AVSpeechUtterance

3-1. 属性

3-2. 初始化方法

4. AVSpeechSynthesisVoice

4-1. 相关属性

1. `AVSpeechSynthesizer`: 语音合成器