文本可视化与XKCD风格绘图指南
1. 从文档构建词云
1.1 准备工作
要生成词云并对数据进行结构化处理,需要使用以下R包:
- wordcloud
- tm
1.2 操作步骤
- 安装并加载包 :
install.packages(c("wordcloud","tm"))
library(tm)
library(wordcloud)
- 读取文本文件 :将包含文本的
obama.txt文件保存到当前R目录,使用readLines()函数读取文件。
file = readLines("obama.txt")
- 文本清理与结构化 :使用
tm_map()函数去除标点符号、停用词、数字和特定词汇。
doc = Corpus(VectorSource(file))
doc = tm_map(doc, tolower)
doc = tm_map(doc, removePun
超级会员免费看
订阅专栏 解锁全文
1534

被折叠的 条评论
为什么被折叠?



