语义模型构建与质量管理要点解析
语义模型的构建
在语义模型构建中,方面分类法是一个重要概念。在方面分类法里,子方面通常会继承其父方面的评价。例如,“美味的”这个评价既适用于“食物”这个实体,也适用于像“汤”或“鸡肉”这样的具体食物。所以,将这些通用评价仅分配给它们适用的最通用方面,然后让子方面通过推理继承这些评价是合理的。为了在模型中实现这一点,定义了这样一个规则:如果方面 A 有评价 E,那么 A 的所有更窄方面也具有这个评价。
为了用具体的实体和关系填充模型,设计并实施了一个半自动流程,该流程旨在实现两个目标:
1. 发现给定领域中已知/已识别方面的评价表达式(及其极性)。
2. 发现涉及先前未知方面的方面 - 评价 - 极性三元组。
具体操作步骤如下:
1. 数据选择 :选择目标领域的意见句语料库(如餐厅评论)作为输入数据。对于第一个目标,还需要一组已知的领域方面实体。
2. 句子筛选 :通过主观性检测系统处理语料库句子,过滤掉不表达意见的句子。
3. 实体识别 :应用命名实体解析系统,确定哪些意见句提到了已知的方面实体。
4. 关系提取 :对所有句子应用关系提取系统,提取方面和评价表达式的对。使用提取对在语料库中的 tf - idf 分数作为对提取对进行排名和微调过程精度/召回率的参数。
5. 极性确定 :
- 为每个唯一的对收集其被检测到的文本上下文(每个句子一个上下文)。
- 对每个上下文进行
语义模型构建与质量管理策略
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



