MFC使用Google Speech API进行语音识别

最新推荐文章于 2021-12-31 14:18:15 发布

原创

最新推荐文章于 2021-12-31 14:18:15 发布 · 1.5k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#语音识别 #google #mfc #google now #引擎 api

本文介绍了如何在MFC项目中利用Google Speech API进行语音识别。作者分享了自己的实践过程，强调了AMR文件格式在语音识别中的优势，以及在处理AMR文件时需要注意的二进制读取和NUL字符问题。通过调试和正确组装数据，可以成功实现语音识别功能。

这段时间需要做个语音识别的程序，由于时间和能力有限，所以不大可能自己做一个识别引擎，怎么办呢，当然是查看度娘了。

这才发现网上其实有很多的解决方案，最出名的莫过于APPLE SIRI 以及GOOGLE NOW这两个识别引擎，GOOGLE NIOW已经在自己的安卓手机上进行了无数次测试，怎么说呢，这识别率简直是爆表啊，就算不是标准普通话，就像我这种川普也是没有问题的；少年你这么猛，你家人知道么

操作之前当然要去看看大神们的研究成果啦，我这里就不说原理了，大家转到这里去看看原帖点击打开链接找不到连接就看这里http://blog.youkuaiyun.com/dlangu0393/article/details/7214728

这里由于楼主以前是搞通信的，所以文件采用amr格式，这东西好啊，压缩率高，专门用来传输人声的，效果很赞哦，关键是还能滤掉杂音，可以提高识别率（自我安慰）

废话说了这么多！上代码

int CGoogleNowDlg::PostGoogleAPI()
{
	char sendata[65536]={0};
	SOCKET sock = ::socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
	if (sock == INVALID_SOCKET)
		return 0;
	SOCKADDR_IN server;
	server.sin_family = AF_INET;
	server.sin_port = htons(80);
	struct hostent *host_addr = gethostbyname("www.google.com");
	if (