今年过年,为了让家人也感受一下公司的技术,我带了一个小度智能音箱回家。
自从配置好wifi的那一刻起,全家人就进入了“点歌模式”,从上个世纪的各种老歌,到“卡路里”、“沙漠骆驼”,后来老爸还“开发”出了听评书的功能。
老妈高兴之余,也开始好奇,这音箱里用了什么新奇技术,能听懂人话。
说到这个话题,我又翻出了几个视频,给老妈讲起来:
要让音箱听懂人话,首先得把我们说话的声音转换成文字,这里用到的就是“语音识别”:
有了文字只是第一步,还需要让机器知道如何理解这一段文字,如何回复这里就用到了“自然语言处理(NLP)”:
以上两种技术,才只是“听懂”的基础,还需要更多复杂的后端逻辑和数据支撑,才能让体验更顺畅。
听完我的讲解,老妈又问,那咱家的音箱,为啥有时候问它一些简单的问题,就会答非所问,有时候干脆就说不会,是不是这两天让家里人玩儿坏了?
家里人一开始只是让音箱做一些唱歌、说评书这样的简单操作,后来爸妈开始跟音箱对话,提一些问题,这时人工智能就显得有些“智障”了,我给老妈翻出了前两天比较火的一篇文章,解释了为什么会出现“智障”的情况:
[链接]人工智障 2 : 你看到的AI与智能无关
简单地说,现在的智能音箱还处于“填格子”阶段,也就是“模板配对”:
老妈知道音箱不是被自己玩儿坏了,终于松了一口气,她表示音箱偶尔的“智障”表现不影响他们“娱乐”,还让我从网上又订了七八个智能音箱,要给亲戚朋友们都送一个。
看来目前的智能音箱产品已经日趋成熟,不太擅长数码产品的父母一辈也能快速和智能音箱“玩”起来,将来每家一台是大势所趋。有兴趣的朋友可以先从PaddlePaddle开始了解深度学习技术和经典NLP模型。
了解PaddlePaddle模型可访问下方链接或点击 阅读原文
http://paddlepaddle.org/documentation/docs/zh/1.2/user_guides/models/index_cn.html#permalink-0-fluid-