多层模型(自底向上):数据分析与挖掘主要是第3-5层
data marts:数据集市,多用于部门,可以比喻为小的数据仓库。
商业版本的R
Revolution R(官网:http://www.revolutionanalytics.com/):可以申请免费下载社区版本。
很多大型厂商也在开始推出自己的R或兼容R的产品,例如Oracle、IBM、Sybase
mode():显示数据类型
rbind():将向量按行结合为矩阵,cbind()则相反。
prod():将数据集中数连乘。
var():方差。
sd():标准差。
由下图可知:“:”的优先级高于运算符*,+,-等。
a[-5]是列出除第5个数之外所有的数。
seq():顺序产生数,默认by为1。
which():得到的是向量的下标。
matrix():数默认是按列排,也可通过byrow=T指定按行。
t():使矩阵转置。
矩阵相乘是a%*%b,非a*b,后者是相对应位置上的数相乘。
diag():对矩阵求对角向量;
对向量求对角矩阵;
参数为常数时求单位向量矩阵。
rnorm():生成正态分布数。
solve():求矩阵的逆矩阵。
solve(a,b):求ax=b方程组的解。
is.数据类型():判断数据类型。
matrix是属于2维的数组。
dim():改变对象的维度,这里将向量变为数组。
frame中每列的数据个数要一样。
支持自定义列名,但注意列名赋值的左右位置,和一般编程语言正好相反。
如果没有print(),程序运行后没有任何结果输出。
round():起到四舍五入的作用,默认转化为整数。
rnorm():无上下限限制,因此要将大于100的数修改为100。
apply():中2指的是按列运算,1指的是按行运算。