
R数据处理
文章平均质量分 62
猿大人007
这个作者很懒,什么都没留下…
展开
-
R - scale()函数标准化
标准化 (Standardization)scale函数标准化处理原理是计算每组的平均值和标准差,再将组内各个数值与其平均值的差,与其标准差的比值,作为该数值在组内的相对数值。(考虑均值和离散程度)归一化(Normalization)归一化:1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。2)把有量纲表达式变成无...原创 2019-11-20 09:46:58 · 5972 阅读 · 0 评论 -
R | 方差分析
方差分析(analysisofvariance ,ANOVA ):用于 两个或两个以上 样本均数的比较 , 还可分析两个或多个研究因素的 交互作用 以及回归方程的 线性假设检验等。(涉及总变异、组内变异、组间变异、自由度)基本思想:把全部观察值间的变异—— 总变异按设计和需要分解成两个或多个组成部分,再作分析。理解:方差分析是分析数据间均值的差异。方差分析的前提条件...原创 2019-11-05 12:18:16 · 6438 阅读 · 0 评论 -
R - 卡方分析
卡方检验,又称χ2检验,是一种非参数检验,主要是比较两个以及两个以上样本率以及两个分类变量之间是否具有显著的相关性,其根本思想是统计样本的实际观测值与理论推断值之间的偏离程度。卡方检验有3种推导过程:四格表法的卡方检验; 行列表法的卡方检验; 列联表法的卡方检验;卡方检验应用情况举个例子,两独立样本率的比较时,所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检...转载 2019-11-05 11:47:04 · 2763 阅读 · 0 评论 -
R - F检验
F检验(方差齐性检验): 主要通过比较两组数据的方差,以确定他们的密度是否有显著性差异(判断两总体方差是否相等,就可以用F检验)。F检验的前提: 数据满足正态分布,使用Shapiro-Will进行正态分布检验# 正态分布检验> shapiro.test(x)> statistic the value of the Shapiro-Wilk statistic.p.val...原创 2019-11-04 16:59:43 · 14956 阅读 · 0 评论 -
R | failed to load cairo DLL
系统 :mac os软件 :R-studio报错信息 :failed to load cairo DLL 、package or namespace load failed for 'Cairo'解决方法:Mac OS X 在 Mountain Lion 之后放弃 X11, 导致出现依赖包丢失。前往 XQuartz 安装 X11 link:https://www.xqua...原创 2019-10-31 10:42:14 · 3348 阅读 · 0 评论 -
R - R包安装
R安装方法一:下载R 安装包(下载路径:https://cran.rstudio.com/src/base/R-3/)./configure; make; make test; make install./configure --prefix=你想安装路径 ; make; make test; make install (非root )方法二:Linux下也可以通过相...原创 2019-10-30 13:58:07 · 3200 阅读 · 0 评论 -
R - 包记录
library(rvest)library(magrittr)library(dplyr)library(tidyr)原创 2019-10-28 18:11:16 · 254 阅读 · 0 评论 -
R - 爬猎聘网职位酬薪
library(rvest)library(magrittr)library(dplyr)library(tidyr)### 单页抓取数据get_job_on_page <- function(url){##1、通过CSS 选择器,抓取网页的数据 #url <- c("https://www.liepin.com/zhaopin/?init=-1&headc...原创 2019-10-28 18:10:15 · 240 阅读 · 0 评论 -
R-多元相关分析与回归分析
相关变量间的关系有两种:一种是平行关系,即两个或两个以上变量相互影响。另一种是依存关系,即是一个变量的变化受到另一个或多个变量的影响。相关分析是研究呈平行关系的相关变量之间的关系。而回归分析是研究呈依存关系的相关变量间的关系。步骤: 建立模型、求解参数、对模型进行检验相关分析:通过计算变量间的相关系数来判断两个变量的相关程度及正负相关。相关系数:两组不同数据的相关程度,取值范围在...原创 2018-11-29 11:11:07 · 1871 阅读 · 0 评论 -
符号秩检验
符号秩检验在R中,wilcox.test()函数可以用来做Wilcoxon秩和检验,也可以用于做Mann-Whitney U检验。当参数为单个样本,或者是两个样本相减,或者是两个参数,paired=F时,是Wilcoxon秩和检验。当paired = FALSE(独立样本)时,就是Mann-Whitney U检验,在R语言中进行符号秩检验可以使用wilcox.test( ) ...转载 2018-11-26 13:48:51 · 3000 阅读 · 0 评论 -
R-项分布、正态分布
二项分布的条件:1) 每次实验结果 , 只能是两个互斥的结果之一 。2) 相同的实验条件下 , 每次实验中事件A 的发生具有相同的概率π 。3) 各次实验独立 , 各次的实验结果互不影响 。2. 二项分布的分布特征 :1) 二项分布的形状取决于n ,π 。2) 当π=0.5 时分布对称 , 近似对称分布 。3) 当π≠0.5 时 , 分布呈偏态 , 特别是 n ...原创 2018-11-12 11:05:17 · 1631 阅读 · 0 评论 -
机器学习之新手入门
转载 博客园 :计算机的潜意识机器学习的定义从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。首先,我们需要在计算机中存储历史的数据。接着,我们将这些 数据通过机器学习算法进行处理,这个过程在机器学习中叫做“训练”,处理的结果可以被我们用来对新的数据...转载 2018-11-05 14:57:50 · 211 阅读 · 0 评论 -
R-单因素方差分析
•因素(factor):通常把影响试验考察指标的条件或要素称为因素,可以是单因素,也可以是多因素。如高三学生的性别;研究养殖日增重量时,品种、饲料、投喂方法等等就是其影响因素。•水平(level):每一个因素根据其质或量所分的等级或所处的状态。如高三性别中男、女;研究饲料对养殖日增重的影响,不同的投喂量成为不同的水平。单因素试验 试验中只考虑一个因素(A),其他因素保持或控制不变或变化一致...原创 2018-11-02 11:54:32 · 1309 阅读 · 0 评论 -
Review: R.MRPP分析
MRPP(Multi ResponsePermutation Procedure)分析,类似于ANOSIM 分析,主要是用于分析高维度数据组间相似性的统计方法。目的:用于评估两组实验数据的整体相似性,以及相似性是否显著。执行:R中vegan包提供了MRPP分析的函数mrpp结果:得到A值、P 值A > 0,表示组间差异大于组内差异A < 0,表示组内差异大于组间差异...原创 2018-10-11 09:23:43 · 1804 阅读 · 0 评论 -
prop.table函数
prop.table函数:频率统计函数(1)prop.table(data):将data转换为百分比(2)prop.table(data,1):将data按行求百分比(3)prop.table(data,2):将data按列求百分比其中需要注意的是data的数据类型为矩阵(as.matrix(data))...原创 2018-08-28 11:47:24 · 12841 阅读 · 0 评论 -
apply函数
plyr包apply把一个function作用到array或者matrix的margins(可以理解为数组的每一行或者每一列)中,返回值时vector、array、list。简单的说,apply函数经常用来计算矩阵中行或列的均值、和值的函数.apply(data.frame,1,fun())上面的指令代表对矩阵b进行行计算,分别对每一行进行求和。函数涉及了三个参数:第一个参数...原创 2018-10-22 15:47:39 · 1204 阅读 · 0 评论