
统计
aihaly
这个作者很懒,什么都没留下…
展开
-
泛化能力
原创 2015-03-29 10:35:06 · 980 阅读 · 0 评论 -
安装R语言的包方法
1. 自动安装(在线安装)在R的控制台,输入install.packages("gridExtra") # 安装 gridExtrainstall.packages("stepNorm", contriburl="http://www.your.url", dependencies = TRUE) # 安装 stepNorm若要指定安装目录 (e.g. “myd原创 2015-06-06 16:04:34 · 1695 阅读 · 0 评论 -
R语言数据文件读写
R语言数据储存与读取1 首先用getwd() 获得当前目录,用setwd("C:/data")设定当前目录 2 数据保存创建数据框d>d data.frame(obs = c(1, 2, 3), treat = c("A", "B", "A"), weight = c(2.3, NA, 9))2.1 保存为简单文本>write.table(d原创 2015-06-24 14:19:21 · 1005 阅读 · 0 评论 -
残差(residual)
在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,σ2)。δ与σ之比,称为标准化残差,以δ*表示。δ*遵从标准正态分布N(0,1)。实验点的标准化残差落在(-2,2)区间以外的概率≤0.05。若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归线拟合。原创 2015-06-23 14:11:29 · 9554 阅读 · 0 评论 -
卷积理解
原创 2015-06-24 08:55:54 · 536 阅读 · 0 评论 -
卷积
在泛函分析中,卷积(捲積)、旋積、疊積或摺積,是通过两个函数f和g生成第三个函数的一种数学算子,表征函数f与经过翻转和平移的g的重叠部分的面积。如果将参加卷积的一个函数看作区间的指示函数,卷积还可以被看作是“移动平均”的推广。 卷积是分析数学中一种重要的运算。设:,是上的两个可积函数,作积分: 可以证明,关于几乎所有的,上述积分是存在的。这样,随着的不同取值,这原创 2015-06-23 15:45:47 · 1141 阅读 · 0 评论 -
白噪声(White noise)
白噪声,是一种功率谱密度为常数的随机信号或随机过程。即,此信号在各个频段上的功率是一样的。由于白光是由各种频率(颜色)的单色光混合而成,因而此信号的这种具有平坦功率谱的性质被称作是“白色的”,此信号也因此被称作白噪声。相对的,其他不具有这一性质的噪声信号被称为有色噪声。 理想的白噪声具有无限带宽,因而其能量是无限大,这在现实世界是不可能存在的。实际上,我们常常将有限带宽的平整信号视为原创 2015-06-23 15:11:36 · 6039 阅读 · 0 评论 -
偏相关函数
偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。p值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度原创 2015-06-23 14:56:23 · 4146 阅读 · 0 评论 -
傅里叶变换
原创 2015-06-24 10:38:18 · 653 阅读 · 0 评论 -
自相关函数
在统计里,两个随机变量X,Y的相关函数定义如下:也就是两个随机变量协方差除以标准差之积。如果X是一个时间的随机变量序列,将不同时间起始点的两个序列Xt和Xs看成两个随机变量,上面的相关函数则可表示为: 如果Xt是一个二阶稳态过程,即均值和方差不随时间而变化。,此时相关函数只是时间差τ=s-t的一个函数,则上式可重写为: 这就是统计学上的自原创 2015-06-23 14:37:13 · 16760 阅读 · 0 评论 -
狄拉克δ函数
在数学中,狄拉克δ函数(Dirac Delta function)是在实直线上定义的,除了零以外的点都等于零,而其在整个定义域上的积分等于1 的广义函数或分布。有时认为δ函数是原点处的一个无限高、无限细,总面积为1的尖峰,物理上代表了理想化的质点或点电荷的密度。它是由理论物理学家保罗·狄拉克引入的。在信号处理中它往往被称为单位脉冲函数 。克罗内克δ函数是其离散的模拟,通常定义在有限域且只有0和原创 2015-06-23 10:59:18 · 7970 阅读 · 0 评论 -
R语言-回归分析
一元线形回归模型:有变量x,y。假设有关系y=c+bx+e,其中c+bx 是y随x变化的部分,e是随机误差。 可以很容易的用函数lm()求出回归参数b,c并作相应的假设检验,如:xylm.solsummary(lm.sol)仅列出部分返回结果:Residuals: Min 1Q Median 3原创 2015-06-18 19:53:51 · 968 阅读 · 0 评论 -
R语言-循环语句
for (n in x) {expr}R中最基本的是for循环,其中n为循环变量,x通常是一个序列。n在每次循环时从x中顺序取值,代入到后面的expr语句中进行运算。下面的例子即是以for循环计算30个Fibonacci数。x for (i in 3:30) { x }while (condition) {expr}当不能确定循环次数时,我们需要用while循原创 2015-06-18 19:59:30 · 23392 阅读 · 3 评论 -
机器学习中的常用分布
基本概念:1. 样本空间:实验所有可能的输出的集合。2. 随机变量:随机变量是一个映射(或函数),将映射到实数集。可以分为离散型随机变量和连续型随机变量。3. pmf和pdf:pmf(probability mass function)为离散型随机变量的概率分布,定义为,有是也写成f(x);对于连续型随机变量,则p称为pdf(probability density fu转载 2015-04-17 11:02:48 · 1653 阅读 · 0 评论 -
朴素贝叶斯方法
前言 朴素贝叶斯(NaïveBayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先是基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯方法实现简单,学习与预测的效率都很高,是一种常用的方法。1.1朴素贝叶斯的学习与分类1.1.1基本方法原创 2015-04-17 10:42:57 · 2852 阅读 · 0 评论 -
R 在使用 .csv檔 的一般問題
在 import .csv資料 時:R指令: > exprs出現 Error in read.table(file = file, header = header, sep = sep, quote = quote, : more columns than column names,這是字元逃逸,先用 excel 打開該.csv檔,檢查內容是否正確,若正確再另存新檔原创 2015-06-07 20:34:25 · 4589 阅读 · 0 评论