- 自然语言生成(Natural Language Generation,NLG)
指从结构化数据中以读取的方式自动生成文本,主要包括三个阶段:
-
文本规划:完成结构化数据中的基础内容规划;
-
语句规划:从结构化数据中组合语句来表达信息流;
-
实现:产生语法通顺的语句来表达文本;
-
研究任务
-
机器翻译
-
情感分析
-
智能问答
-
文摘生成
-
文本分类
-
舆论分析
-
知识图谱
- 萌芽期(1956年以前)
贝叶斯方法、隐马尔可夫、最大熵、支持向量机……,主流仍为基于规则的理性主义方法;
- 快速发展期(1980~1999年)
基于统计、基于实例和基于规则的语料库技术在这一时期蓬勃发展;
- 突飞猛进期(2000年至今)
神经网络与深度学习;
-
基本术语
-
分词(segment)
-
词性标注(part-of-speech tagging&#