- 博客(10)
- 收藏
- 关注
原创 R语言数据处理
一、缺失值的处理 任何规模的项目都可能存在缺失值,缺失值会影响数据的呈现 1、检测缺失值 R语言中提供了is.na()来检测缺失值是否存在 sum(is.na(nhanes2)) #计算数据集nhanes2中的缺失值总数 is.na(mydata) 2、如何处理缺失值 ①直接剔除该字段 rm(mydata['key1']) ②分析中排除缺失值 y=sum(x,na....
2019-07-29 11:48:06
544
原创 pyhton语言基础一丨数据类型和变量
1)整数 例如:100 2)浮点数 例如:3.1415 3)字符串 例子:'hello word' 4)列表 例如:【1,2,3,4】 5)字典 例如:【‘hello’:3】 6)数组 例如:array(【1,2,3】) 7)长整型 例如:1000000L 8)布尔型 例如:TRUE,FALSE 9)元组 例如:('ring', 1000) 10)集合 例如:...
2019-06-22 10:36:01
178
原创 R语言基本统计方法
很多时候我们做数据分析就是为了分析出每个变量之间的关系,并且做出相应的指导方向,落实到执行,有哪些分析方法了? 一、描述性统计分析 1)方法云集 用summary()函数来获取描述性统计量 apply()函数或sapply()函数计算所选择的任意描述性统计量 函数fivenum()可返回图基五数总括(Tukey’s five-number summary,即最小值、下四分位数、中位数、上...
2019-06-21 10:47:55
4734
原创 R语言的基本图形
1)条形图 barplot()函数,水平条形图则添加(horiz=TRUE) 2)堆砌条形图 barolot(, legend=rownames(counts)) 3)分组条形图 (beside=TRUE) 4)均值条形图 先利用mean=means(order(means$x),) 5)棘状图 vcd包中的函数spine()绘制 6)饼图 pie(x,labels) a....
2019-06-20 16:56:48
560
原创 R语言中数据的高级处理
1)数值和字符的处理函数 数学函数“: abx:绝对值 sqrt:平方根 ceiling(x):不小于x的最小整数 floor(x):不大于x的最大整数 trunc(x):向0的方向截取x的整数部分 round(x,digits=n):将x舍入为指定的小数,其中n为小数点几位 signif(x,digits=n):将x舍入为指定的有效字位数,例如3.475,digits=2,返回值...
2019-06-20 14:55:10
1131
原创 R语言中的数据管理(数据处理)
1)创建新变量 利用表达式即可创建,例如+ - * /等形式 例如:mydata=transfrom(mydata,sumx=x1+x2,meanx=(x1+x2)/2) 2)变量的重编码 定义:重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程 方法:使用R语言中的一个或多个逻辑运算符,例如< <=,>,>=,!=,!x,x丨y 函数within(...
2019-06-20 11:09:35
869
原创 R语言中图形中有哪些常常使用的函数?
一、用于指定符号和线条类型的参数(par()函数) pch:指定绘制该点是使用的符号(小图形) cex:指定符号(图形大小)的大小 lty:指定线条类型 lwd:指定线条宽度 二、针对颜色相关的函数 col:绘制颜色 col.axis:坐标轴刻度线的颜色 col.lab:坐标轴标签(也就是数字的颜色) col.main:标题颜色 col.sub:副标题颜色 fg:图形前景色 ...
2019-06-19 17:58:29
2541
原创 R语言中处理对象的实用函数有哪些?
1)length()函数 对象中的元素/成分的数量 2)dim(object) 显示某个对象的维度 3)str(object) 显示某个对象的结构 4)class(object) 显示某个对象的类或类型 5)mode(object) 显示对象的模式 6)names(object) 显示对象中各成分的名称 7)c(object,object ....) 将多个对象合并入一个...
2019-06-19 16:01:27
664
原创 R语言数据集标注
目的:为了使结果更易解读,数据分析人员通常会对数据集进行标注 形式:通常这种标注包括为变量名添加描述性标签以及为类别型变量中添加值标签 标签类型: 1)变量标签 方法是将变量标签作为变量名,然后通过 位置下标来访问这个变量 2)值标签 factor()可为类别型变量创建值标签 例子: patientdata$gender=factor(patientdata$gender,l...
2019-06-19 15:43:14
2412
原创 R语言数据结构的分类
数据集 定义:指的是由数据构成的一个矩形数组 数据结构的类型 1)向量 定义:向量是用于存储数值型、字符型或逻辑型数据的一维数组 c()函数创建 2)矩阵 定义:矩阵是一个二维数组,只是每个元素都拥有相同的模式 matrix(元素,行的维数,列的维数,byrow是按行填充还是按列填充,)函数创建 3)数组 定义:数组(array)与矩阵类似,但是维度可以大于2 通过ar...
2019-06-19 14:51:24
441
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅