
统计与分析
xiewenbo
互联网广告行业呆过几年,旅游公司呆过几年,对机器学习,自然语言处理,图像识别,个性化推荐 有兴趣
展开
-
RMYSQL
最近在做股票的高频交易数据分析,需要用到数据库,而我只对MySQL比较熟悉,于是就安装了MySQL。当我安装好了MySQL后,正兴冲冲地准备安装RMySQL包时,问题来了:RMySQL包不支持windows操作系统!!!晴天霹雳啊!真的不支持吗?在花了n个小时,查阅了大量的英文资料后得出一个结论:在windows操作系统下,RMySQL包可以安装成功。 现将安装方法分享一下,让纠转载 2013-06-09 02:00:04 · 1213 阅读 · 0 评论 -
Pearson correlation coefficient
1简介皮尔森相关系数皮尔森相关系数(Pearson correlation coefficient)也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数。皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本量,分别为两个变量的观测值和均值。r描述的转载 2013-11-21 17:05:12 · 1148 阅读 · 0 评论 -
Covariance
在概率论中,两个随机变量 X 与 Y 之间相互关系,大致有下列3种情况:当 X, Y 的联合分布像上图那样时,我们可以看出,大致上有: X 越大 Y 也越大, X 越小 Y 也越小,这种情况,我们称为“正相关”。当X, Y 的联合分布像上图那样时,我们可以看出,大致上有:X 越大Y 反而越小,X 越小 Y 反而越大,这种情况,我们称为“负转载 2013-11-21 16:45:52 · 999 阅读 · 0 评论 -
主成分回归在径流预测中的应用
摘要: 采取主成分回归方法对具有多重共线性的湘江流域43 a径流资料进行了分析,以实测径流量、降水量和蒸发量等7 个指标进行了样本预测。结果表明:主成分回归比多元线性回归的误差小,预测值更接近于实测值。关键词: 多重共线性; 主成分回归; 多元线性回归; 径流预测中图分类号: P333 文献标识码: A doi: 10.3969 /j.issn.1000-1379.2012.0转载 2013-12-16 21:53:55 · 2804 阅读 · 0 评论 -
cbind&rbind
Combine R Objects by Rows or ColumnsPackage:baseTake a sequence of vector, matrix or data frames arguments and combine by columns or rows, respectively. These are generic functions转载 2014-03-31 09:58:40 · 1321 阅读 · 0 评论 -
note code
>x> x[1] 1 2 3 4 5 6 7 8 9mx> mx [,1] [,2] [,3][1,] 1 4 7[2,] 2 5 8[3,] 3 6 9> res> res [,1] [,2] [,3][1,] 1 16 49[2,] 4 25转载 2014-03-31 09:59:13 · 707 阅读 · 0 评论 -
R语言进阶之3:数据汇总/透视/提炼
一、行列求和、平均值和频度rowSums, colSums, rowMeans, colMeans 可以简单理解为按行或列求和或求均值,table把数字或字符当成因子统计频度,都相当简单:> a - array(rep(1:3, each=3), dim=c(3,3)) > a [,1] [,2] [,3] [1,] 1 2 3 [2,] 1 2转载 2014-04-03 21:25:37 · 880 阅读 · 0 评论 -
R common function
转载 2014-05-16 14:50:25 · 585 阅读 · 0 评论 -
AIC(最小信息准则)
数字信号处理中对多种模型作选择的判别方法。AIC信息准则即Akaike information criterion,是衡量统计模型拟合优良性的一种标准,由于它为日本统计学家赤池弘次创立和发展的,因此又称赤池信息量准则。它建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。在一般的情况下,AIC可以表示为: AIC=2k-2ln(L)其中:k是参数的数量转载 2014-07-16 20:26:43 · 12465 阅读 · 0 评论