健康科普与科学文献的对比研究
在健康领域,科普文献和科学文献在语言形态上存在显著差异。通过对这些差异的研究,有助于实现医学话语的自动区分,为信息分类和传播提供依据。
形态材料的准备
在形态层面区分专家话语和大众话语时,基础词的使用是一个重要标准。这包括基础词所能形成的词位,以及这些单位在分析文献中的系统性和使用频率。
- 基础词的选择 :针对每种话语类型和医学专业,选择特定语料库中的基础词,这些基础词代表着最大的形态家族。以“cardio”为例,在心脏病学学生语料库中,它能形成多达57个词位。我们保留了“cardio”,并比较了它在心脏病学专家语料库(26个)和科普语料库(20个)中的生成能力,同时也参考了肺病学和糖尿病语料库的数据。
- 形态家族的构建 :形态家族是通过词位形成规则,将形式和语义相关的词位组合在一起。每个形态家族围绕一个基础词形成,我们依据Derif的词法 - 语义分析来进行。例如:
- angioblastique/ADJ: [[angi N } [blast N } ique ADJ}
- cardiogenique/N’Obd: [[[cardio N } [gene V } ique ADJ} NOM}
- electrocardiographie/NOM: [[electr N } [[cardio N } [graphie N } NOM} NOM}
- echocardiographie/NOM: [[echo N } [[cardio N
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



