
R
IT界的小小小学生
写文章的目标不仅是解决问题,更是帮助阅读的人或企业实现商业价值。秉持 “从解决问题出发、在实践中学习,最终创造价值”的信念,予人玫瑰手留余香!
展开
-
RStudio中,出现中文乱码问题的解决方案
RStudio中,出现中文乱码问题的解决方案解决步骤:1、设置RStudio文本显示的默认编码:RStudio菜单栏的Tools -> Global Options2、选择General -> Default Text Encoding,点击Change:3、在弹出的编码中,选择UTF-8编码。4、点击OK,然后再点击OK,保存设置。5、最后,在打开文件原创 2017-02-24 13:05:30 · 18787 阅读 · 0 评论 -
R语言读CSV、txt文件方式以及read.table read.csv 和readr(大数据读取包)
首先准备测试数据*(mtcars)分别为CSV. TXTread.table 默认形式读取CSV(×)与TXT(效果理想) ①> test<-read.table("C:/Users/admin/Desktop/test.txt",header = F)Error in scan(file = file, what = what, sep = sep, quote = quote, d原创 2017-07-18 15:35:43 · 13613 阅读 · 0 评论 -
Core-periphery decomposition--核心-外围模型R代码整理
SNA中:中心度及中心势诠释(不完整代码) Core-periphery decomposition--核心-外围模型R代码整理 本文是从网易博客搬家过来的,具体模型图片无法显示,暂时通过流程直通车连接,查看,核心-边缘模型原始数据及展示(R)模型描述与R代码整理R调整后训练结果#注意:#后为注释,#控制台展示数量控制options(max.print=1000000)#加载所需开发包rea原创 2017-01-13 13:44:47 · 2592 阅读 · 0 评论 -
R语言读CSV、txt文件方式以及read.table read.csv 和readr(大数据读取包)
首先准备测试数据*(mtcars)分别为CSV. TXT**2018博客之星评选,如果喜欢我的文章,请投我一票,编号:No.009** [支持连接](https://blog.youkuaiyun.com/HHTNAN/article/details/85330758) ,万分感谢!!! R语言数据分析案例:直通车read.table 默认形式读取CSV(×)与TXT(效果理想)...原创 2017-01-24 12:23:26 · 83778 阅读 · 4 评论 -
R语言之系统聚类(层次)分析之图谱形式完整版
读取数据常见错误:在读取数据过程中可能遇到以下问题,参照上一篇博客:可能遇到报错:1、Error in if (is.na(n) || n > 65536L) stop(“size cannot be NA nor exceed 65536”) : missing value where TRUE/FALSE needed没有处理数据转化距离。 2、Error in h原创 2018-02-07 16:40:02 · 19687 阅读 · 0 评论 -
绘制动态心形图案::R语言绘制心形图
原始方程源于此贴一楼:直通车整理修改后: 被窝修改成这样:xq(-1.1,1.1,length = 3000)rep30y3000,rep) #创建矩阵yx3000,rep) #创建矩阵xx3000,rep) #创建矩阵cq(0,1,length=rep) #立体效果for (i in 1:rep)for (p in 1:3000){y[p,i]1-(x[p])^2)原创 2018-02-07 17:11:05 · 15163 阅读 · 0 评论 -
hadoop-R语言-安装NLP自然语言分析包
引言: R语言是一种非常强大的分析与展示的统计科学家工具,其也提供了若干关于自然语言的分析处理工具,本文讲展示如何在Linux进行安置。1. 自然语言处理(NLP) 对于英语体系,基于空格可以直接进行分词,而中文则不同,需要进行分词,然后进行后续处理。NLP是natural language processing的缩写,专指此类的工作。 自然语言处理包: Snowball, RWeka原创 2016-12-27 10:47:06 · 888 阅读 · 0 评论 -
用R进行文本分析初探——包含导入词库和和导入李白语句
用R进行文本分析初探——以《红楼梦》为例 一.写在前面的话~ 刚吃饭的时候同学问我,你为什么要用R做文本分析,你不是应该用R建模么,在我和她解释了一会儿后,她嘱咐我好好写这篇博文,嗯为了娟儿同学,细细说一会儿文本分析。文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术。顾名思义,文本数据挖掘是从文本中进行数据挖掘(Data Mining)。从转载 2016-12-27 10:49:21 · 7269 阅读 · 1 评论 -
基于R语言利用QQ群进行数据挖掘案例整理
利用QQ群进行数据挖掘案例,数据源来源于2016年12-2017年大致一个月的QQ群基本数据,通过对聊天内容的分析,了解QQ聊天群资料了解时间,人群以及关键词,并构建相应图表、云图等,下图为本人所在提取的QQ群: 以下是R代码部分:file.data<-scan("C:/Users/admin/Desktop/数据挖掘机器学习R-hive.txt",what="",sep=...原创 2017-01-19 14:13:49 · 5012 阅读 · 0 评论 -
R语言绘制正太分布图,并进行正太分布检验
正态分布判断一样本所代表的背景总体与理论正态分布是否没有显著差异的检验。方法一 概率密度曲线比较法 看样本与正太分布概率密度曲线的拟合程度,R代码如下:#画样本概率密度图s <- rnorm(100) #产生样本d <- density(s)plot(d, col="green", ylim=c(0, 0.5))#添加正太分布概率密度图s2 <- seq(from=-...原创 2016-12-27 10:45:24 · 5357 阅读 · 1 评论 -
R语言中文分词工具
Rwordseg、Rweibo、tm的安装使用默认方法安装相关R中文文本挖掘包(tmcn、Rwordseg、Rweibo)时,会出现安装失败。合适的方法是:通过源代码安装相关包的程序:手工下载源代码及其依赖,然后编译安装。首先是基础性的tm包。tm包是R文本挖掘的通用包。直接使用install.package即可安装。1install.packages("tm"原创 2016-12-27 10:46:58 · 825 阅读 · 0 评论 -
r软件安装过程中,rjava 安装完成版
在做文本挖掘的时候,会发现分词时候rJava是必须要迈过去的坎儿,所以进行了总结:第一步:安装rJava和jdkinstall.packages("rJava")JDK:D:\jdkR:D:\spss 21\R-3.0.11.配置好java2.配置rJava第二步:设置环境变量 ,涉及java调用R(我的电脑右键-属性-高级设置-环境变量)CLASSPATH=D:\spss 21\R-3...原创 2016-12-27 10:47:19 · 1500 阅读 · 0 评论 -
下载和安装R、RStudio !~~~
现如今,R语言是统计领域广泛使用的工具,是属于GNU系统的一个自由、免费、源代码开放的软件,是用于统计计算和统计绘图的优秀工具。而RStudio是R的集成开发环境,用它进行R编程的学习和实践会更加轻松和方便。下面就教大家如何下载并安装R和RStudio,比较简单。R的维护工作由一个国际化的开发者团队负责。R软件的官方下载页面叫作The Comprehensive R Archive Network原创 2016-12-27 10:48:35 · 3260 阅读 · 0 评论 -
SNA社交网络R语言分析
数据来源KONECT【1】 http://konect.uni-koblenz.de/networks/facebook-wosn-links 原文来源:http://www.afenxi.com/post/5728数据原始格式. txt文本格式,空格分隔. 注释信息以%开头. 每行一组数据,共四个字段 第一字段:用户ID1 第二字段:用户ID2原创 2016-12-27 10:48:37 · 3834 阅读 · 1 评论 -
igraph软件包创建图和网络(创建邻接矩阵)
一、igraph软件包创建图和网络igraph 是一个独立的库,底层是 C,上层有 Python 和 R 接口,主要做图和网络方面的计算,附带绘图功能。调试顶点的大小(参数vertex.size)和顶点标签(参数vertex.label.cex)的大小。igraph中图的数据结构igraph中基本的graph structure采用的是EdgeList,所以在igraph中自然而然的允原创 2016-12-27 10:48:43 · 8980 阅读 · 1 评论 -
ggolot2 画ROC曲线
为了进一步了解ggplot2的使用,利用ROC曲线进行说明学习。####获取画图数据(data.frame格式)#####library(ggplot2)library(ROCR) ##用于计算ROCdata(ROCR.simple) ###画图数据集pred <- prediction(ROCR.simple$predictions, ROCR.simple$labels)原创 2016-12-27 10:49:13 · 1186 阅读 · 0 评论 -
R语言自带的数据文件
R语言有大量的样本数据可以直接用来作为数据分析和挖掘案例,可以收藏着以后用!R:datasets>install.packages("datasets") ##一般不需要安装,多数版本R语言自带这个包向量euro #欧元汇率,长度为11,每个元素都有命名landmasses #48个陆地的面积,每个都有命名precip #长度为70的命名向量rivers #北美141条河流长度state.ab原创 2016-12-27 10:49:34 · 4338 阅读 · 0 评论 -
R语言-networkd3.生成一个基于html的插件,可以动态交互,
http://christophergandrud.github.io/networkD3/ http://www.htmlwidgets.org/showcase_networkD3.html原创 2016-12-27 10:49:52 · 1966 阅读 · 0 评论 -
数据的标准化与中心化以及R语言中的scale详解
1.数据的中心化所谓数据的中心化是指数据集中的各项数据减去数据集的均值。例如有数据集1, 2, 3, 6, 3,其均值为3,那么中心化之后的数据集为1-3,2-3,3-3,6-3,3-3,即:-2,-1,0,3,02.数据的标准化所谓数据的标准化是指中心化之后的数据在除以数据集的标准差,即数据集中的各项数据减去数据集的均值再除以数据集的标准差。例如有数据集1, 2, 3, 6, 3,其均值原创 2016-12-27 10:50:06 · 2477 阅读 · 0 评论 -
机器学习之随机森林(R)randomFordom算法案例
1.随机森林原理介绍 随机森林,指的是利用多棵树对样本进行训练并预测的一种分类器。该分类器最早由Leo Breiman和Adele Cutler提出,并被注册成了商标。简单来说,随机森林就是由多棵CART(Classification And Regression Tree)构成的。对于每棵树,它们使用的训练集是从总的训练集中有放回采样出来的,这意味着,总的训练集中的有些样本可能多次出现在一棵原创 2017-01-17 10:27:15 · 15726 阅读 · 3 评论