本文从自然语言处理技术的研究出发,对优必选的自然语言处理在机器人中的应用,如场景交互中的多轮对话问题,以及AI写作创作等方面进行全面解析,并对优必选自然语言处理在机器人上的应用案例进行解析。内容分为以下5个部分:
1、服务机器人语音交互技术概述
2、自然语言处理技术概述与发展
3、优必选自然语言处理技术的研究与开发
4、优必选自然语言处理技术在服务机器人上的应用
5、优必选自然语言处理技术未来研究方向
服务机器人语音交互技术概述
如上图所示,人的语音通过ASR(语音识别)把音频变成文本,文本经过NLU(语义理解)、DM(对话管理)以及NLG(语言生成),生成的语言在通过TTS(语音合成),最后机器人完成对话。
自然语言处理技术概述与发展
首先来几个段子,相信大家在网上经常看到类似的段子,比如“货拉拉拉不拉拉布拉多”,这个是一个典型的中文分词问题,生活中给大家带来不少的麻烦。另外我相信大家都在拼音输入法上翻过车,“答辩”打成“大便”,这是一个典型的语言模型问题,后面会介绍语言相关的模型。还有在前段时间比较火的满分作文生成器,可以用它来生成类似的满分作文,后边也有文本生成的算法介绍。
自然语言处理技术可以分为基础技术和核心应用。其中,基础技术包括自动分词、词性标注、命名实体识别以及句法分析。
自动分词是自然语言处理领域最基础的工作,以前主要基于规则和概率统计,现在已经发展到基于深度学习。比如“武汉市长 江大桥”还是“武汉市 长江大桥”等都是通过统计模型可以把词分配好。
词性标注就是在分完词后,利用算法把每个词的词性标注上。通常词性标注的粒度可以很细,比如可以标注动词、副动词、趋向动词、不及物动词等。
命名体识别是指识别具有特定意义的实体,比如人名、地名、机构名、专有名词等。
句法分析主要是指分析句中的主谓宾、定状补的句法关系。它的应用非常广泛,情感、信息、问答、机器翻译、自动文摘、阅读理解以及文本分类等。
上图是自然语言处理的四个阶段,第一阶段:在2000年之前,主要是基于规则和基于概率统计的方法。在50年代提出了图灵测试的概念来判断机器是否会思考,到目前为止,还没有出现大家一致认可的对话系统通过图灵测试。第二阶段:在2013年,随着神经网络的兴起,极大的提升了NLP的各项能力。第三阶段:基于seq2seq模型的NLP和注意力机制,在文本生成和机器翻译方面获得了比较大的进展。第四阶段是2018年以来,大型预训练模型的发展,也是我们现在所处的阶段。
优必选自然语言处理技术的研究与开发
目前,优必选的研究方向分为以下几种:
1、任务型对话,主要是把意图词槽以及上下文的一些信息给抽取出来,在日常生活和服务机器人上用的比较多。
2、开放式闲聊,主要基于多轮的语料,做了一些开放式的闲聊。
3、文本生成,主要是一些创作类的文本生成,开放式闲聊也用到了一些文本生成的技术。
4、知识图谱,为了提升交互体验以及赋予对话更多的知识,我们也在做这方面的尝试。