自然语言处理中的问题改写与程序合成
1. 问题改写概述
问题改写的任务是将可能格式不正确的问题 $q$ 转换为格式良好的自然语言问题 $q_w$,同时保留其语义和意图。一个格式良好的问题需满足以下约束条件:
- 语法正确:常见的语法错误包括第三人称单数或动词时态的误用。
- 无拼写错误:拼写错误特指打字错误和其他拼写错误,不包括动词第三人称单数或时态误用等语法错误。
- 表述明确:格式良好的问题必须表述明确并以问号结尾,命令或类似搜索查询的片段不是格式良好的问题。
2. 相关研究与应用
- 查询改写 :在赞助搜索中有时会进行查询改写,但与我们将格式不正确的问题改写为格式良好的问题的目标不同。一些研究通过搜索查询日志数据库来找到语义相似的查询以替换原始查询,还有研究基于用户点击信息计算查询相似度进行查询排名,以及学习问题的释义来改进问答系统等。
- 释义生成 :释义生成已在多个应用中得到使用,如作为数据增强技术训练自然语言理解(NLU),组成对抗性释义以评估和增强模型准确性,利用机器翻译构建释义并学习句子嵌入用于语义文本相似度计算等。
- 正向 + 逆向机器翻译 :这是一种有效的问题或句子释义方法,先将句子翻译成另一种中间语言,然后再翻译回原始语言,例如有人同时使用德语和法语进行这种翻译。
3. 从自然语言获取操作指令
近年来,在从自然语言、示例或混合方法进行程序合成方面有很多工作。许多计算领域有自然语言文档描述其能力和动态,正确
超级会员免费看
订阅专栏 解锁全文
932

被折叠的 条评论
为什么被折叠?



