wordcloud(词云)

本文介绍如何利用R语言中的jiebaR包进行中文分词,并通过plyr等包统计词频,最终生成词云。文章还提供了一些实用技巧,如处理转义字符及寻找第三方词云生成工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.分词

当今在R界最流行的中文分词包莫过于jiebaR了,有人用segmentCN,问题重重。
jiebaR分词后的词性worker=(“tag”),tagger<=”words“,即可展示分词后词的词性。
tips:
  1. \t \r \n都是转义字符,空格就是单纯的空格,输入时可以输入空格
  2. \t 的意思是 横向跳到下一制表符位置
  3. \r 的意思是 回车
  4. \n 的意思是回车换行

2.频数

其实这是很重要的一步,没有这一步,Wordcloud只能做梦了。我的方法里面没有建立频数数据框,方便了但数据框有时候用来分析更有用,所以
tips:
  1. library(plyr)
  2. table_seg<-count(seg) 数据框的话,后面可以使用table_seg[,1],table_seg[,2]
  3. 但是我用的时候有bug,缓存的table_seg在后面不能引用,说是找不到

3.云词

##windows
library(jiebaR) 
library(jiebaRD)
library(plyr)
library(RColorBrewer)
library(wordcloud)

f<-scan('F:\\huaqiangu_sense.txt',sep='\n',what='',encoding="cp936")##what为数据类型
seg1<-qseg[f]
seg2<-seg1[nchar(seg1)>1]

seg<-table(seg2)
colors=brewer.pal(8,"Dark2")
wordcloud(names(seg),seg,colors=rainbow(length(names(seg))),random.order=F,random.color=F,ordered.colors=T)
最后的云词展示:这里写图片描述
tips:
  1. 想不想有好看、花哨的云词? 跨网找云词成像制作工具。
  2. 他的名字叫:TagxeDo
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值