R文本分析
chenlongzhen_tech
[声明] 此账号不在更新,请关注 http://blog.youkuaiyun.com/tech_chenlongzhen
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
win8.1 rJAVA和Rwordseg安装
关杀毒软件! 安装java配置好环境环境rjava安装 http://jliblog.com/archives/10必须从这里下载安装Rwordseg https://r-forge.r-project.org/R/?group_id=1054原创 2015-04-18 17:22:58 · 1206 阅读 · 0 评论 -
词频统计
(来自R艺术)#单词位置findwords <- function(tf) { # read in the words from the file, into a vector of mode character txt <- scan(tf,"") wl <- list() for (i in 1:length(txt)) { wrd <- txt[i] #转载 2015-03-24 16:25:29 · 1104 阅读 · 0 评论 -
rvest包文档简易翻译
rvest网页爬虫encoding调整字符编码描述: 这些函数能帮助你对那些有错误编码声明的 网页进行调整.你可以使用guess_encoding 得到正确编码, 或者用repair_encoding来休整字符型向量. 使用: guess_encoding(x) repair_encoding(x, from = NULL) 参数: 参数 说明 x 字符型向量 from翻译 2015-04-29 21:51:40 · 6505 阅读 · 0 评论 -
R 分词记录
http://rstudio-pubs-static.s3.amazonaws.com/12422_b2b48bb2da7942acaca5ace45bd8c60c.htmlhttp://qinwenfeng.com/jiebaR/原创 2015-08-10 16:57:35 · 578 阅读 · 0 评论 -
R 正则表达式例子
my_fenci <- function(line){# line1 <- gsub("http","网址", line ,ignore.case =T)# line2 <- gsub("[a-z]|#|:|/|[0-9]","", line1 ,ignore.case =T)# # line3 <- gsub("原创 2015-08-10 16:32:51 · 632 阅读 · 0 评论
分享