网络作为语料库:关键问题解析
在语言学研究领域,将网络视为语料库的新兴概念正逐渐受到关注。这不仅仅是要突出使用网络作为语料库的优缺点,还需要根据网络作为“自发”“自我生成”文本集合的特定特征,重新解读语料库语言学中的一些关键问题,并探索由此产生的新问题。
1. 语料库与网络:关键议题概述
网络作为语料库的概念看似对语料库语言学的一些基本标准提出了质疑,但实际上为进一步探索语料库工作良好实践所依赖的一些理论和方法论问题提供了机会。从网络的角度重新审视这些问题,有助于设想在万维网的影响下语料库语言学的“变化面貌”。其中,最相关的问题包括真实性、代表性、规模和构成,下面将逐一进行讨论,同时简要提及版权问题。
1.1 真实性
语料库语言学的一个基本假设是,语料库中包含的所有语言都是真实的。而网络最显著的特点之一,就是它无疑是真实、有目的语言行为的宝库。网络本质上是人们在真实的人际互动中产生的真实文本的集合,这些人的目的“不是展示他们的语言能力,而是通过语言实现某种目标”。
网络作为真实语言的来源,与计算机数据存储带来的“对真实例子的日益尊重”的背景密切相关。如今,在寻找语言证据时,向外观察社会而非向内审视思维已成为一种趋势,而网络恰好可以提供这样的语言使用证据,它是其所反映的“社会”的一个组成部分。此外,数字革命导致电子格式的真实数据呈指数级增长,这与对经验主义的偏好之间可能存在相互影响。网络作为大量电子格式真实语言的存储库,免费且易于获取,这使得语料库语言学方法变得更加流行和容易实现。
真实性使网络成为“语言学家的绝佳游乐场”,是一个前所未有的开放空间,可用于探索语言形式上的可能性与实际表现之间的相互作用。其无计划的包容性
超级会员免费看
订阅专栏 解锁全文
84

被折叠的 条评论
为什么被折叠?



