多层模型(自底向上):数据分析与挖掘主要是第3-5层
data marts:数据集市,多用于部门,可以比喻为小的数据仓库。
商业版本的R
Revolution R(官网:http://www.revolutionanalytics.com/):可以申请免费下载社区版本。
很多大型厂商也在开始推出自己的R或兼容R的产品,例如Oracle、IBM、Sybase
mode():显示数据类型
rbind():将向量按行结合为矩阵,cbind()则相反。
prod():将数据集中数连乘。
var():方差。
sd():标准差。
由下图可知:“:”的优先级高于运算符*,+,-等。
a[-5]是列出除第5个数之外所有的数。
seq():顺序产生数,默认by为1。
which():得到的是向量的下标。
matrix():数默认是按列排,也可通过byrow=T指定按行。
t():使矩阵转置。
矩阵相乘是a%*%b,非a*b,后者是相对应位置上的数相乘。
diag():对矩阵求对角向量;
对向量求对角矩阵;
参数为常数时求单位向量矩阵。
rnorm():生成正态分布数。
solve():求矩阵的逆矩阵。
solve(a,b):求ax=b方程组的解。
is.数据类型():判断数据类型。
matrix是属于2维的数组。
dim():改变对象的维度,这里将向量变为数组。
frame中每列的数据个数要一样。
支持自定义列名,但注意列名赋值的左右位置,和一般编程语言正好相反。
如果没有print(),程序运行后没有任何结果输出。
round():起到四舍五入的作用,默认转化为整数。
rnorm():无上下限限制,因此要将大于100的数修改为100。
apply():中2指的是按列运算,1指的是按行运算。
本文详细介绍了数据分析与挖掘领域的关键概念和技术,包括多层模型、datamarts、商业版本的R及其应用,以及R语言中的核心函数如mode()、rbind()、prod()、var()、sd()等。此外,还探讨了R语言中的优先级规则、seq()、which()、matrix()、t()、矩阵相乘、diag()、rnorm()、solve()等功能,并解释了如何使用apply()函数进行按列或按行运算。

被折叠的 条评论
为什么被折叠?



