语料库与方言研究:数字化时代的新视角
1. 传统与现代方言研究对比
传统方言研究与现代方言研究存在诸多差异,具体如下表所示:
| 对比项目 | 传统方言研究 | 现代方言研究 |
| — | — | — |
| 数据量 | 有限 | 无限 |
| 维度 | 大多一维 | 大多多维 |
| 研究方式 | 具体研究 | 整体研究 |
| 研究基础 | 基于样本 | 基于语料库 |
| 技术运用 | 不使用技术 | 大量使用技术 |
| 文本处理工具运用 | 不使用文本处理工具 | 大量使用文本处理工具 |
| 研究内容 | 研究方言在地理区域的差异 | 研究方言中信息和知识的编码方式 |
| 数据收集方式 | 基于问卷的引出法 | 大多为自由话语文本 |
| 研究目的 | 记录 | 恢复、知识生成 |
| 方言社区参与度 | 方言社区不参与 | 方言社区直接参与 |
从表中可以看出,现代方言研究在各个方面都有了显著的提升和拓展,尤其是引入了语料库的概念,为方言研究带来了新的活力。
2. 重新定义方言研究:基于语料库的方言研究方法
基于语料库的方言研究方法旨在为传统方言研究面临的问题提供更好的解决方案。该方法的核心是数字化的方言语料库,它遵循语料库语言学的方法和原则进行开发。
2.1 方言语料库的构成
数字化的方言语料库以忠实和统一的方式包含书面和口语互动文本的样本。书面部分存储了多种书面文本样本,而口语部分则存储了从各种口语互动中收集的口语文本样本。在方言分析和解释的后续阶段,两种类型文本的比例代表
语料库驱动的方言研究新范式
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



