埃莱娜·费兰特作品作者归属研究
1. 初步分析与PCA结果
通过主成分分析(PCA)对费兰特与来自坎帕尼亚的所有作家进行研究,发现费兰特与多梅尼科·斯塔诺内之间存在一定的风格关联。在PCA图中,第一个主成分占比91.0%,第二个主成分占比4.9% 。从时态使用上看,斯塔诺内更多使用现在时态,如“sono(我是)”“è(他/她是)”“ho(我有)”“ha(他/她有)”;而费兰特更多使用过去时态,如“aveva(他/她有)”“era(他/她是)”。通过计算欧几里得距离,发现费兰特与斯塔诺内之间的距离最小,这初步表明费兰特小说的真正作者可能是斯塔诺内。
2. Delta模型分析
- 步骤一:确定词表
- 通常考虑语料库中前50 - 1000个最频繁的词类型(MFWs),这里选取从意大利语料库中提取的前50、100、150、200、250、300、400和500个MFWs。为定义这些词表,会丢弃想要确定真正作者的小说。
- 由于意大利语形态比英语丰富,也可以选择词元(lemma)。不过,由于最频繁的词是限定词、代词、介词或连词,考虑词元时变化不大,但当列表长度大于200时可能会有一些变化。
- 步骤二:生成作家档案
- 为所有可能的小说家(不包括费兰特)生成档案。将每位作家所写的所有书籍连接起来,构建其档案(即词类型及其相对频率),只考虑选定的词类型,且每个词的关联值是其标准化频率或Z分数。
- 步骤三:生成
超级会员免费看
订阅专栏 解锁全文
115

被折叠的 条评论
为什么被折叠?



