大数据环境下自然语言生成介导的通信:以Nomao为例
1. 引言
在当今社会,基于认知的资本主义模式下,信息管理和大众传播的知识对各领域的参与者具有重要意义。自然语言生成(NLG)作为大数据领域的热门话题,能够将大数据转化为人类可读且语义恰当的文本形式,提升了大数据的社会经济价值。在数据新闻领域,如《洛杉矶时报》的Quakebot、美联社的Wordsmith等“机器人记者”,以及法国的Yseop公司提供的基于NLG的决策支持系统,都展示了NLG的广泛应用。
Nomao自2007年起编辑法国当地企业的在线目录,其NLG系统在该目录文本内容的生成中发挥着重要作用。本文旨在深入研究Nomao的NLG系统,探讨其设计和使用方式,以及终端用户对生成文本的阅读和理解情况。
2. Nomao的自然语言生成系统(NLGs)
Nomao的NLG系统按照典型的NLG阶段进行设计,包括宏观规划、微观规划和表面实现。
2.1 宏观规划
宏观规划分为两个子步骤:
- 内容选择 :从专用数据库中查询有关企业的信息,包括企业标识符、名称、街道地址、城市、附近地铁站、附近企业、类别、标签和相关术语等。
- 文档结构构建 :确定文本的修辞结构,包括标题段落、介绍段落、主要段落、描述地铁站的段落和“意见”段落。
2.2 微观规划
微观规划包括四个子步骤:
- 句法规划 :为每个信息单元随机选择预定义的句法模式。
- 词汇化
超级会员免费看
订阅专栏 解锁全文

3837

被折叠的 条评论
为什么被折叠?



