语言与文化的勾勒:从词汇对比到文化探究
1. Sketch Engine的词汇对比功能
Sketch Engine不仅能为单个词汇生成词素描,还具备比较两个词汇素描的特定功能。该功能会突出两个词汇共享的模式和组合,同时对比各自特有的模式和组合。例如,从ukWaC语料库中对“scenery”和“landscape”进行对比,其共享搭配的模式和组合会根据显著性得分排序,并根据得分差异进行颜色区分,以强调对某个词汇的偏好。
| 词汇 | 常用修饰形容词 |
|---|---|
| scenery | splendid, breathtaking, awe - inspiring, spectacular, stunning, glorious |
| landscape | wooded, rural |
各自独特的模式或组合会在单独的列中呈现。这种对比分析与仅通过探索索引行获取的信息有明显的质量差异,而且这些数据是在短时间内对ukWaC语料库中“scenery”的25,445次出现和“landscape”的110,908次出现进行总结得到的。
不过,使用这些数据和工具时需谨慎。虽然通过半自动化网络爬取创建的语料库数据在质量和数量上比网络本身更可靠,但仍有局限性,因为它们仅来自特定时间段下载的网站。而且工具可能无法准确识别特定语言类别,导致结果误导。例如,在对形容词“light
超级会员免费看
订阅专栏 解锁全文
117

被折叠的 条评论
为什么被折叠?



