R语言txt文件自定义词云图

最新推荐文章于 2024-01-07 18:49:24 发布

木子拓哉

最新推荐文章于 2024-01-07 18:49:24 发布

阅读量3.7k

点赞数 3

分类专栏： R语言词云图文章标签： 1024程序员节

本文链接：https://blog.youkuaiyun.com/LLLevi/article/details/120943346

版权

本文介绍了如何使用R语言从txt文本中获取数据，进行词频统计，并利用jiebaR和wordcloud2包创建自定义词云图，特别是结合排球少年的图片，提供了一个完整的R语言词云图制作流程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在R语言中获取txt文件文本，并进行词频统计，然后自定义词云图。

先获取txt文本

wordfreqs = read.table("E:\\Python实训\\哔哩哔哩弹幕爬取\\dan_mu.txt"
                       ,encoding = "UTF-8")

这是事先用python爬虫准备好的B站番剧（排球少年）弹幕文本（当然也可以先自定义文本进行测试）。

停止词

readLines("E:\\数据处理\\PyDataPreprocessing-master\\Files\\NLPIR_stopwords.txt"
          )

work <- worker(stop_word = "E:\\数据处理\\PyDataPreprocessing-master\\Files\\NLPIR_stopwords.txt"
)

这也是准备好的停止词词库，用于帮助jiebaR更好的统计词频

统计词频

seg <- segment(wordfreqs[,1],work)

seg <- freq(seg)  //用于统计词频 
 
seg <- seg[order(-seg[,2]),]  // 让它倒序排序 

seg <- seg[1:100,c(1,2)]  // 限制输出词的数量，只输出100个。