【科学文献计量】外文文献及中文文献关键词的挖掘与可视化

本文档详细介绍了如何对外文和中文文献的关键词进行词频统计和词云可视化,包括不同期刊的关键词特征分析。通过数据处理和筛选,优化词云图的显示效果,展示关键词的分布和重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 关键词的挖掘与可视化

1.1 外文文献关键词词频统计与可视化

在前一章节介绍知识单元完整频次统计中已经对关键词ID和DE字段进行词频统计。在回顾知识点的基础上,进一步进行可视化操作。可以新建一个ipynb文件,在导入功能库和文件后,利用multi_element_count()进行多元素字段的词频统计。
在这里插入图片描述
可将上述的频数统计结果,借用词云图可视化结果输出。首先需要将多元素字段频数统计的结果进行处理,形成绘制词云图的DataFrame数据格式,即第一列为标签字段中多元素的分类名称,第二列就为各类名称出现的频数统计。然后在将两列的数据合并,组成分类名称和频数一一对应的列表,即words变量(词云图的核心就是在于words变量的构造),如果有需求可以对图形的标题进行注解,比如这里将NAME赋值为ID,就是表明当前展示的词云图结果来自于ID字段。
在这里插入图片描述
ID字段的多元素词频统计结果词云可视化输出如下。元素的频数统计值越大,在词云图中的文字越大。通过滑动鼠

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值