
R
文章平均质量分 60
HTUN
Computer Science
展开
-
R中进行PCA主成分分析
1. PCA优缺点利用PCA达到降维目的,避免高维灾难。PCA把所有样本当作一个整体处理,忽略了类别属性,所以其丢掉的某些属性可能正好包含了重要的分类信息2. PCA原理 条件1:给定一个m*n的数据矩阵D, 其协方差矩阵为S. 如果D经过预处理, 使得每个每个属性的均值均为0, 则有S=DTDS=D^TD。PCA的目标是找到一个满足如下性质的数据变换: - 每对不同的新属性的协方差为原创 2015-04-12 12:27:53 · 7755 阅读 · 0 评论 -
使用R进行文本数据挖掘
1. 前期准备环境64-bit Linux Mint, R_3.0.2安装Shell//RCurl所需sudo apt-get install libcurl4-openssl-devRinstall.packages("bit64")install.packages("RCurl")install.packages("httr")1. 数据集使用Twitter数据集. 安装如下:instal原创 2015-05-16 12:16:05 · 1009 阅读 · 0 评论 -
Emacs中使用R
所需插件http://ess.r-project.org/index.php?Section=home下载上一网址的安装包并进行安装,安装完毕后,ess一般被安装到了/usr/share/emacs/site-lisp/ess下,当然也可使用命令 sudo find / -type f -name “ess.el” 查找ess的安装目录Emacs配置在.emacs文件中添加(add-to-li原创 2015-05-29 21:56:37 · 3502 阅读 · 0 评论 -
使用R进行时间序列分解
非季节性数据的时间序列分解数据http://robjhyndman.com/tsdldata/misc/kings.dat分析非季节性的数据包含两个组成成分,分别为随机噪声和趋势。为了能使用加性模型(Additive Model)描述非季节性数据的趋势成分,我们使用平滑法(SMA)来计算一个时间序列的移动平均。在使用SMA计算时间序列的移动平均值时,需设定跨度n。R代码library("TTR")原创 2015-06-04 22:48:57 · 8520 阅读 · 1 评论 -
ARIMA(p,d,q)模型-1-MA模型
ARIMA模型介绍ARIMA并不是一个特定的模型,而是一类模型的总称。他的3个参数p, d, q分别表示自相关(p阶AR模型), d次差分,滑动平均(q阶MA模型)。因此有, - p = d = 0, ARIMA模型即MA(q)模型; - d = q = 0, ARIMA模型即AR(p)模型;MA模型含义当前时刻的值可以表示为过去干扰项和当前干扰项的线性组合。MA模型描述符号和前原创 2015-06-07 11:17:41 · 34563 阅读 · 1 评论