R语言文本分词以,词频统计,云图显示的简洁方法

安装相应的包

install.packages('jiebaR')
install.packages('wordcloud')



程序代码(RStudio平台上)

#对于不同类型结构的数据,导入的方式要有所选择!!! 

file <-readLines("C:\\Users\\Administrator\\Documents\\R\\data.txt",encoding ="gbk")  
 
seg <- qseg[file]    #使用qseg类型分词,并把结果保存到对象seg中

seg <- table(seg) #统计词频

seg <- seg[!grepl('[0-9]+',names(seg))] #去除数字

length(seg)      #查看处理完后剩余的词数

seg <- sort(seg, decreasing = TRUE)[1:100] #降序排序,并提取出现次数最多的前100个词语

seg           #显示如下图1   

bmp("comment_cloud.bmp", width = 500, height = 500)       #设置图片形成效果     
par(bg = "black")
wordcloud(names(seg), seg, colors 
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Eton2016

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值