第1章:R简介,变量,向量,数组,矩阵,数据框,读写文件,控制流

本文详细介绍了数据分析与挖掘领域的关键概念和技术,包括多层模型、datamarts、商业版本的R及其应用,以及R语言中的核心函数如mode()、rbind()、prod()、var()、sd()等。此外,还探讨了R语言中的优先级规则、seq()、which()、matrix()、t()、矩阵相乘、diag()、rnorm()、solve()等功能,并解释了如何使用apply()函数进行按列或按行运算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

多层模型(自底向上):数据分析与挖掘主要是第3-5层

data marts:数据集市,多用于部门,可以比喻为小的数据仓库。



商业版本的R
Revolution R(官网:http://www.revolutionanalytics.com/):可以申请免费下载社区版本。
很多大型厂商也在开始推出自己的R或兼容R的产品,例如Oracle、IBM、Sybase

mode():显示数据类型

rbind():将向量按行结合为矩阵,cbind()则相反。


prod():将数据集中数连乘。

var():方差。

sd():标准差。

由下图可知:“:”的优先级高于运算符*,+,-等。

a[-5]是列出除第5个数之外所有的数。

seq():顺序产生数,默认by为1。

which():得到的是向量的下标。

matrix():数默认是按列排,也可通过byrow=T指定按行。

t():使矩阵转置。

矩阵相乘是a%*%b,非a*b,后者是相对应位置上的数相乘。

diag():对矩阵求对角向量;

对向量求对角矩阵;

参数为常数时求单位向量矩阵。

rnorm():生成正态分布数。

solve():求矩阵的逆矩阵。

solve(a,b):求ax=b方程组的解。

is.数据类型():判断数据类型。

matrix是属于2维的数组。

dim():改变对象的维度,这里将向量变为数组。

frame中每列的数据个数要一样。

支持自定义列名,但注意列名赋值的左右位置,和一般编程语言正好相反。

如果没有print(),程序运行后没有任何结果输出。

round():起到四舍五入的作用,默认转化为整数。

rnorm():无上下限限制,因此要将大于100的数修改为100。

apply():中2指的是按列运算,1指的是按行运算。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值