Unity 科大讯飞离线语音合成

最新推荐文章于 2025-10-27 10:40:53 发布

原创

最新推荐文章于 2025-10-27 10:40:53 发布 · 3.5k 阅读

25 ·

CC 4.0 BY-SA版权

文章标签：

#语音识别

本文介绍了一种使用C#实现的离线语音合成方法，并对比了在线语音合成方式。通过引入特定SDK及参数配置，实现了流畅自然的语音输出。文中详细记录了从SDK下载到代码实现的全过程。

该文章已生成可运行项目，

好久没有更新文章了，今天我们继续更新科大讯飞的语音的文章。
之前在语音合成部分由于在线语音合成的处理时间太长，所以使用了C#自带的语音合成，处理是快了，但是合成的声音特别难听。
所以今天更新一个离先语音合成的文章。
废话不多说，直接进入正题。

1.下载语音合成SDK，需要选择离线的，否者无法使用离线的。

2.解压SDK，这里我们需要用到common.jet；xiaofeng.jet；xiaoyan.jet这三个.jet文件必须要，缺一不可，否则会报错误代码：文件缺失。然后就是msc_x64.dll库。

3.代码部分

using UnityEngine;
using msc;
using System;
using System.Text;
using System.IO;
using System.Runtime.InteropServices;
using System.Threading;
using UnityEngine.Networking;
using System.Collections;

public class Main : MonoBehaviour
{
    private const string speekText = "北京市今天全天晴，气温7℃ ~ 19℃，空气质量优，有北风4-5级，挺凉快的。";
    private const string session_begin_params = "voice_name = xiaoyan, text_encoding = utf8, sample_rate = 16000, speed = 50, volume = 50, pitch = 50, rdn = 0";
    private string offline_session_begin_params;
    private IntPtr session_id;
    private int err_code;

    private byte[] bytes;

    private void Awake()
    {
        string xiaoyan_path = (Application.dataPath + "/TTS/xiaoyan.jet").Replace("/", "\\");
        string common_path = (Application.dataPath + "/TTS/common.jet").Replace("/", "\\");
        offline_session_begin_params = "engine_type = local, voice_name = xiaoyan, text_encoding = utf8, tts_res_path = fo|" + xiaoyan_path + ";fo|" + common_path + ", sample_rate = 16000, speed = 50, volume = 50, pitch = 50, rdn = 0";
    }

    private void Start()
    {
        int message = MSCDLL.MSPLogin("", "", "appid=5f80198b,word_dir= . ");
        if (message != (int)Errors.MSP_SUCCESS)
        {
            Debug.LogError("登录失败！错误信息：" + message);
        }
        Debug.Log("登录成功");
    }

    private void Update()
    {
        if (Input.GetMouseButtonDown(0))
        {
            //Online_TTS(speekText);
            Offline_TTS(speekText);
        }
    }

    private void Online_TTS(string speekText)
    {
        //语音合成开始
        session_id = MSCDLL.QTTSSessionBegin(session_begin_params, ref err_code);

        if (err_code != (int)Errors.MSP_SUCCESS)
        {
            Debug.LogError("初始化语音合成失败，错误信息：" + err_code);
            return;
        }
        //语音合成设置文本
        err_code = MSCDLL.QTTSTextPut(session_id, speekText, (uint)Encoding.Default.GetByteCount(speekText), string.Empty);
        if (err_code != (int)Errors.MSP_SUCCESS)
        {
            Debug.LogError("向服务器发送数据失败，错误信息：" + err_code);
            return;
        }

        uint audio_len = 0;
        SynthStatus synth_status = SynthStatus.MSP_TTS_FLAG_STILL_HAVE_DATA;
        MemoryStream memoryStream = new MemoryStream()

本文章已经生成可运行项目

最低0.47元/天解锁文章

15 条评论

编程的风 2025.03.25
试用版过期
- VAIN_K回复编程的风 2025.03.26
  替换自己的离线SDK和appid appkey

编程的风 2025.03.24
音频0字节，无法播放，咋解决
- List_Script回复编程的风 2025.03.25
  同样问题，工程一开始可以生成正常播放，后面突然就不行了[face]emoji:031.png[/face]
- VAIN_K回复编程的风 2025.03.25
  检查是否有写入数据

List_Script 2025.03.11
我这边也一直出现 Audio clip""could not be played的报错，之前好的突然就不行了😳，这种咋解决，请教大佬们
- 编程的风回复List_Script 2025.03.24
  问下，您生成额音频能播放么

都好都行都可以 2024.09.09
离线转换在编辑器里有用，发布pc就不行了
- List_Script回复都好都行都可以 2025.03.11
  请问是怎么解决的的？请指教下，我也一直出现Audio clip ""could not be played的erro，之前还可以，突然就不可以了[face]emoji:002.png[/face]
- 都好都行都可以回复都好都行都可以 2024.09.18
  解决了
- 都好都行都可以回复VAIN_K 2024.09.18
  一发布pc 就是 Audio clip "" could not be played. FMOD Error: An invalid parameter was passed to this function. 用的自己的appid
- VAIN_K回复都好都行都可以 2024.09.11
  打包Debug模式，看看错误日志