
R语言与统计分析
内容涉及R语言本身和数据挖掘;
A叶子叶
大数据平台、数据仓库、数据分析/挖掘、应用开发、深度学习、爬虫
展开
-
R语言中的vector(向量),array(数组)总结
对于那些有一点编程经验的人来说,vector,matrix,array,list,data.frame就相当于编程语言中的容器,因为只是将R看做数据处理工具所以它们的底层是靠什么实现的,内存怎么处理的具体也不要深究。R语言很奇怪的是它是面向对象的语言,所以经常会调用系统的方法,而且更奇怪的是总是调用“谓语”的方法,用起来像是写句子一样,记起来真是让人费解。比如is.vector(),read.原创 2016-04-09 12:10:13 · 110245 阅读 · 2 评论 -
R语言中的matrix(矩阵),list(列表),data.frame(数据框)总结
一、R语言中的矩阵matrix是一个二维的数组array,因此数组array的一些操作它也适用。①它与array相比,特有的是矩阵的一些运算,例如:求维度:dim(A)转置:t(A)求行列式:det(A)矩阵相乘:x%*%y对角运算:diag(A)求逆:solve(A,b)求特征值和特征向量:eigen(A)奇异值分解:svd(A)②在多维数组中,apply原创 2016-04-09 13:10:12 · 78980 阅读 · 0 评论 -
R中读写数据文件
一、首先确定当前工作目录,或者改变当前工作目录。> getwd()[1] "e:/RStudio">setwd("e:/RStudio")二、读取纯文本文件的两个函数,一个是read.table(),另一个是scan()函数。①read.table()> r=read.table("test1.txt")> r age sex weight height1原创 2016-04-09 23:03:38 · 6199 阅读 · 0 评论 -
R遗漏
一、R中的函数文档查看。两种方式> help("read.csv")> ?read.csv()二、rc=read.csv("config1.csv",header=FALSE),默认值header是TRUE,当为FALSE时候,即指不需要读取第一个行。原创 2016-04-09 23:13:50 · 5650 阅读 · 0 评论 -
R中的函数
一、函数的定义格式为:>name 可以看做是:y=f(x)的写法。expression是R的表达式,括号内是参数,放在函数最后的是返回值,返回值可以是向量,数组,列表,数据框。R函数是一定要有返回值的。二、函数的语句:if:switch:for:while:repeat:break,next:二、函数的导入和应用①函数可以以文件的原创 2016-04-10 17:17:32 · 5921 阅读 · 0 评论 -
python中的pandas小试
在实习的项目中,得到宽表后的后续工作是用R语言写的,包括数据探索,数据清洗,建模,模型分析。因为之前用过python,写过简单爬虫,就想着自己试着将R语言的脚本写成python,或许对于未来有帮组、然而,在pyhon3.5连接teradata的问题上一直搞不通、、、所以,只能先学一下pandas之类的基础了,本来想法是直接将R语言改成python,简单粗暴的方法也是最有效的做法。一、p原创 2016-06-30 17:36:56 · 7485 阅读 · 0 评论 -
R语言中用jdbc连接数据库
一、项目用的是R语言,中间有用jdbc连接数据的步骤,数据库为Td数据库,本来用到了TeradataR的包,最后还是统一用了jdbc自带的方法来接收返回值和执行查询语句。首先加载RJDBC包:指令:library(RJDBC)①连接方式:jdbc()、dbConnect()函数jdbc(驱动,地址)得到驱动函数dbConnect(驱动,ip地址/数据库名,登录名,登录密原创 2016-07-03 18:10:47 · 8797 阅读 · 0 评论