中英文文献标题及摘要可读性指标分析与可视化
新建一个ipynb文件,导入需要使用的python库,并将程序连接到Mysql数据库(也可以按照前面的操作进行本地文献数据的读取)。

分别读入CNKI和Scopus文献数据,为了方便阅读,只显示前两行记录。

1 文本可读性指标原理以及计算流程
句子可读性的评估借助cntext库下面的readability模块完成。针对于中英文献,计算的可读性指标不同,其中英文文献可读性指标计算公式:
e n g l i s h _ r e a d a b i l i t y = 4.71 x ( c h a r a c t e r s / w o r d s ) + 0.5 x ( w o r d s / s e n t e n c e s ) − 21.43 english\_readability = 4.71 x (characters/words) + 0.5 x (words/sentences) - 21.43 <
本文探讨了中英文文献标题和摘要的可读性指标,利用cntext库进行计算和可视化分析。对于中文文献,重点讨论了可读性指标的计算流程,包括字符、副词和连词的比例。通过对CNKI和Scopus数据的处理,展示了不同期刊和年份的文献可读性分布,并提供了可视化图表,揭示了标题和摘要的可读性差异。
订阅专栏 解锁全文
460

被折叠的 条评论
为什么被折叠?



