文本理解:从字典到数学集合论
1. 文本理解基础
文本类对象的解释依赖于科学知识或常识知识。理解文本 T 即探寻其含义,不同类型文本含义的构成有所不同:
- 文本任务 TT 的含义:由现实世界情况 MR(TT) 和待解决的文本任务类别含义 MS(TT) 两部分组成,可表示为 M(TT) = MR(TT) ⊕ MS(TT)。
- 字典文本 TD 的含义:通常由现实世界情况 MR(TD)、抽象类别 MA(TD) 和神话世界类别 MT(TD) 构成,即 M(TD) = MR(TD) ⊕ MA(TD) ⊕ MM(TD)。
- 长文本 TL 的含义:包括现实世界情况 MR(TL)、抽象类别 MA(TL)、神话世界类别 MT(TL) 或待解决的文本任务类别含义 MS(TL),表示为 M(TL) = MR(TL) ⊕ MA(TL) ⊕ MM(TL) ⊕ MS(TL)。
2. 字典文本理解
字典文本指字典或百科全书中的短文。理解字典文本需基于已学习的解释脚本,具体步骤如下:
1. 学习相关形式与脚本 :学习查询形式、基本形式、程序形式和解释脚本。不同字典文本包含不同科学领域知识。
2. 构建模型 :解释脚本 J 由其指向的现象模型给出,该模型基于所有可获取知识构建,与理解水平相关。基础理解层面,模型包含理解所学字典文本所需信息。
3. 文本分组 :将用于学习的字典文本按相同基本含义分组,学习每组的基本形式,且基本形式需与模型一致。
4. 分类与学习查询形式 :将字典文本按基
超级会员免费看
订阅专栏 解锁全文
1655

被折叠的 条评论
为什么被折叠?



