(此文为回忆后撰写,未进行重新测试,故不尽之处敬请指出。)
1、tm包是R中文本挖掘的通用包。直接使用
install.packages("tm")
2、tmcn、Rwordseg、Rweibo是李舰等人开发的中文文本挖掘包。详见
http://jliblog.com/app/rwordseg
三个网页中提供了包说明与安装方法。但经测试,其中的安装方法不可用。
(相对于jiliblog.com,r-forge的信息更新)
3、我的安装方法
(1)下载tmcn、Rwordseg、Rweibo的源码
tmcn:https://r-forge.r-project.org/R/?group_id=1571
Rwordseg:(r-forge中找到)
Rweib

本文介绍了如何在R中安装中文文本挖掘包tm、tmcn、Rwordseg和Rweibo。作者指出tm包可以直接使用,而tmcn、Rwordseg和Rweibo的安装需要从r-forge获取源码,并且Rwordseg依赖于rJava,需先安装Java环境。Rweibo则依赖于RCurl、rjson、XML和digest四个包,需从科大源下载源码安装。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



