利用网络资源进行语言学研究:挑战与工具
在当今数字化时代,网络已成为信息的巨大宝库,对于语言学研究而言,它也蕴含着丰富的语言数据。然而,网络的“无政府状态”以及普通搜索引擎的局限,给语言学研究带来了挑战,但也催生了一些专门的工具来应对这些问题。
从语料库视角看网络搜索
网络搜索在我们的社会中无处不在,它与语料库语言学方法的结合为语言学研究开辟了新的途径。当我们在网络上搜索单个单词时,实际上是从几乎无穷无尽的网络语料库中瞬间创建了一个临时的有限子语料库。例如,搜索“ecoturismo”会从网络中创建一个与生态旅游相关的意大利语文本的临时虚拟子语料库;而搜索“cancer”时,结果可能既涉及疾病,也涉及星座,这时可以使用“NOT”运算符(如“cancer –horoscope”或“cancer –patients –disease –treatment”)来细化查询。
搜索两个或更多单词可以从共现的角度进行解读,并为每个搜索项创建共文本,这可以大致解释为领域、主题或范畴。搜索短语并结合通配符的使用,可以代表对搭配或模式的搜索。此外,语言、URL和域名限制,或在网络的特定子部分进行搜索,可以间接从地理变异、语域和体裁的层面进行约束。
要提高搜索结果的质量,语言学家需要逐步细化查询,使其更加复杂。查询是网络搜索的常见实践与语言学家将网络视为语料库的理论方法最富有成效的交互点。在通过普通搜索引擎将网络作为语料库使用时,提交查询和解释结果时采取谨慎的程序至关重要。
以下是一些相关的操作示例和思考问题:
1. 探索商业搜索引擎的区域版本 :
- 步骤:访问google.co.uk并提交查询(如“
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



