Unity实现文字转语音并且与人物模型口型同步

原创

已于 2023-09-28 17:12:25 修改 · 6.7k 阅读

51 ·

CC 4.0 BY-SA版权

文章标签：

#unity #音频

于 2023-09-28 17:11:45 首次发布

文章目录

前言
一、插件介绍
二、导入RTVoice
- 1.插件传送门
- 2.组件配置
三、导入OVRLipSync
- 1.插件传送门
- 2.组件配置
总结

前言

提示：这里可以添加本文要记录的大概内容：

今天我们用Unity实现文字转语音并且与人物模型口型同步，要实现这个功能，我们需要用到两个插件：语音口型同步“OVRLipSync”和文字转语音“RTVoice”。

一、插件介绍

RTVoice：
离线文字转语音
• 支持所有构建平台！
• 适合于 Windows、macOS、Android 和 iOS 的原生提供程序
将文本转换为语音
• 即时从文本转换到语音 — 在运行时即可生成！
• 连带作用：连续的音频生成可节省大量内存！
• 在游戏的测试阶段无需配音演员！
• 按姓名、文化和/或性别筛选语音
• 一次可以发出多种声音（例如，公共场所中很多人同时讲话的场景）
• 通过语速、音调和音量微调你的声音！
• 支持 SSML 和 EmotionML！
• 在 Windows 和 iOS 上提供最新的单词、唇形和音素 — 包括标记！
• 生成的音频可以存储为文件在 Unity 中反复使用！
• 单个 AudioSource 匹配 1-infinite 同步发音人！
• 简单的顺序和对话系统
• 不降低性能！
OVRLipSync：
语音来源，顾名思义就是语音的来源，一般有两种，一是真人配音，语音自由度最大，真实度最好。另一个是通过语音合成技术（Text To Speech，简称TTS），在时间、空间以及实现成本上有很大优势。在语音驱动人脸动画领域，有一个重要的步骤——获取基于时间轴的音素序列，真人配音很难直接获取准确的基于时间轴的音素序列，通过TTS技术产生语音序列的同时获得序列相对来说很容易。

识别与动画关键帧匹配。识别是指在语音波段中识别音素，所谓音素是构成音节的最小单位，又或者说是最小语音片段，以汉语为例，每个独立的声母，单韵母都是一个独立的音素，普通话中声母有23个，单韵母有10个，鼻辅音2个，在英文中有20个元音和28个辅音，地位同汉语中声韵母相

最低0.47元/天解锁文章

16 条评论

陈卫华开心 2024.04.26
使用lipsync里面的模型嘴部可以正常动，但是使用自己导入的模型（readyplayerme导出的模型）就会报错 Array index (15) is out of bounds (size=2) UnityEngine.StackTraceUtility:ExtractStackTrace () OVRLipSyncContextMorphTarget:SetLaughterToMorphTarget (OVRLipSync/Frame) (at Assets/Oculus/LipSync/Scripts/OVRLipSyncContextMorphTarget.cs:189) OVRLipSyncContextMorphTarget:Update () (at Assets/Oculus/LipSync/Scripts/OVRLipSyncContextMorphTarget.cs:127)
- 耿聪聪.回复陈卫华开心 2024.10.14
  我跟你一样的情况，请问你现在解决了吗
- 安东尼王回复陈卫华开心 2024.04.29
  建议参考示例工程中的模型修改自己的模型，特别是注意面部Blendshaps部分

qq_24954189 2024.04.16
怎样选择男声？

qq_24954189 2024.04.15
这个插件使用以后在别的电脑上不能够正常使用？？读取不出来

Grit_007 2024.01.26
这个唇形同步插件，中文效果怎么样，很多中文效果都不好
- SYF大好人回复scarlet梦 2025.03.30
  SALSA我选的那个DAZ预设，测试过效果还行。另外，卡通人物可能会简单一些。另外，不是必须全部五十多个变形blendshape都加。
- scarlet梦回复安东尼王 2024.01.29
  salsa lipsync和这个比起来哪个中文的效果更好
- 安东尼王回复Grit_007 2024.01.26
  中文效果也不太好，现在支持中文口型的技术很少，如果你有这方便的技术也可能大家一起学习一下[face]emoji:008.png[/face]

junq1105 2024.01.02
OnAudioFilterRead事件不触发，只要使用AudioSource的对象去接收了Microphone.Start后，OnAudioFilterRead事件就不触发，口型就对不上！这是我自己用代码实现的，使用up说的这两个插件，也是只有发音，口型不动。请up大佬指点一下，感谢感谢

m0_70335744 2023.12.08
请问有实现打包到安卓成功实现文字转语音播报的吗
- m0_70335744回复安东尼王 2023.12.11
  谢谢博主了，直接导入到安卓端不行，看一下讯飞或百度吧
- 安东尼王回复m0_70335744 2023.12.08
  博客中的插件在安卓端还没有测试过，你可以试试，如果不行需要你集成讯飞或百度文字转语音安卓版本得SDK，看一下集成文档，不麻烦[face]emoji:015.png[/face]