论文全名:Learning to Solve Arithmetic Word Problems with Verb Categorization
模型简称:ARIS
任务:math word problem
论文链接:https://aclanthology.org/D14-1058/
官方项目网站:https://www.cs.washington.edu/nlp/arithmetic(数据集下载地址失效了,看了一下代码是用Java写的……我退缩)
本文是2014年EMNLP论文,是第一个不用预定义模版来解决MWP问题(仅考虑加减场景)的工作。
识别问题中的相关变量和数值,映射到公式中。通过识别7种动词,来分析数学题类型。
(每个动词都识别一下)
简单来说就是识别每个数字对应是加还是减,然后放进公式

1. MWP任务介绍
问题首先描述一个状态,然后介绍在状态上的改变,最后提出一个量化问题。
问题中有些信息是无用的。
2. ARIS

预测句子中的动词种类,将问题ground到全局状态转变(由动词种类建模得)。
整个问题被分成很多fragments/句子,每个fragment代表一种状态的转变。
将每个句子表征concat起来,生成公式。
动词种类:
- Observation:初始化
- Positive:加
- Negative:减
有2个container句子的种类:
- Positive transfer
- Negative transfer
- Construct:都涨
- Destroy:都降

全局状态: < E , C , R > <E,C,R> <E,C,R>
实体:数字被关注的那个对象
container(大概类似“实例”的概念,持有属性的对象,如有9只小猫的莉齐)
关系(实体、container、属性(黑色、walnut)、数量(可以是数字、变量、表达式)之间的关系)
(我觉得这种描述方式是很奇怪的,我怀疑是之前的工作有这方面的详细介绍,跟现在的不同)
h
h
h:名词种类集合
每个数字关联一个实体
然后反正这部分没咋看懂,大致来说就是用规律和语法解析树硬把结构给抠出来。用SVM训练模型。
根据动词来选择公式符号,这种感觉?

3. 实验
3.1 数据集

3.2 指标
准确率(经3折交叉验证的)
3.3 主实验结果

ARIS
2
_2
2
Majority是把所有数字都直接加起来
Gold ARIS是直接用真实句子分类
3.4 实验分析


ARIS是2014年EMNLP上的一项研究,首次尝试不用预定义模板解决加减法的数学文字问题。该模型通过识别7种动词来分析问题类型,将句子分段并映射到公式中。实验基于准确率进行评估,展示了处理数学问题的新方法。

被折叠的 条评论
为什么被折叠?



