语音服务的核心功能之一是能够识别并转录人类语音(通常称为语音转文本)。 本快速入门介绍如何在应用和产品中使用语音 SDK 来执行高质量的语音转文本转换。
跳转到 GitHub 上的示例
如果要直接跳到示例代码,请参阅 GitHub 上的 C# 快速入门示例。
先决条件
本文假定你有 Azure 帐户和语音服务订阅。 如果你没有帐户和订阅,可以免费试用语音服务。
安装语音 SDK
如果只想开始使用包名称,请在 NuGet 控制台中运行 Install-Package Microsoft.CognitiveServices.Speech。
有关特定于平台的安装说明,请参阅以下链接:
创建语音配置
若要使用语音 SDK 调用语音服务,需要创建 SpeechConfig。 此类包含有关你的订阅的信息,例如你的密钥和关联的区域、终结点、主机或授权令牌。 通过使用密钥和区域创建 SpeechConfig。 请参阅查找密钥和区域页面,查找密钥区域对。
using System;
using System.IO;
using System.Threading.Tasks;
using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;
class Program
{
async static Task Main(string[] args)
{
var speechConfig = SpeechConfig.FromSubscription("", "");
}
}
可以通过以下其他几种方法初始化 SpeechConfig:
使用终结点:传入语音服务终结点。 密钥或授权令牌是可选的。
使用主机:传入主机地址。 密钥或授权令牌是可选的。
使用授权令牌:传入授权令牌和关联的区域。
备注
无论你是要执行语音识别、语音合成、翻译,还是意向识别,都需要创建一个配置。
从麦克风识别
若要使用设备麦克风识别语音,需使用 FromDefaultMicrophoneInput() 创建 AudioConfig。 然后初始化 SpeechRecognizer,传递 audioConfig 和 speechConfig。
using System;
using System.IO;
using System.Threading.Tasks;
using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;
class Program
{
async static Task FromMic(SpeechConfig speechConfig)
{
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var recognizer = new SpeechRecognizer(speechConfig, audioConfig);
Console.WriteLine("Speak into your microphone.");
var result = await recognizer.RecognizeOnceAsync();
Console.WriteLine($"RECOGNIZED: Text={result.Text}");
}
async