
数学基础
Evan_Gu
专注大数据可视化和可视分析相关的理论、方法与技术,探索行业中最佳实践与应用。
展开
-
逻辑训练题
逻辑问题 1、你能把多少个相同的球放进一个直径是它们直径3倍的大球中?答:一个球同时最多与另外12个相同的球接触:中线上围6个,两端各放3个。因此,可以装下 13个球。这类问题属于 接合数(kiss number)问题 2、 数列 1 ,5,14,30, (?)答: 1=1 4=1+2x2 14=1+2x2+3x3原创 2015-01-25 20:32:32 · 1147 阅读 · 0 评论 -
蒙特卡罗(Monte Carlo)
一 起源蒙特卡罗(Monte Carlo)方法,或称计算机随机模拟方法,是一种基于”随机数”的计算方法。这一方法源于美国在第一次世界大战进研制原子弹的”曼哈顿计划”。该计划的主持人之一、数学家冯?诺伊曼用驰名世界的赌城-摩纳哥的Monte Carlo-来命名这种方法,为它蒙上了一层神秘色彩。Monte Carlo方法的基本思想很早以前就被人们所发现和利用。早在17世转载 2016-10-19 14:43:03 · 2822 阅读 · 0 评论 -
使用R进行逻辑回归 分类
逻辑回归模型 属于分类模型,二元分类器。类似的二元分类器还有决策树、随机森林、支持向量机以及神经网络。 逻辑回归模型相对于k-邻近模型,具有“运行时间”低的优势。 当数据空间很大时,预测新数据的类别需要计算这个数据点的k个“邻居”,因此需要把所有的新旧数据点都存在内存中,这通常会耗费大量的“运行时间”。而线性模型则不然,无论模型更新还是用作实际预测,它的速度通常都令原创 2016-01-29 17:14:12 · 2461 阅读 · 0 评论 -
什么是模型,什么是模式
模型(model)与模式(Pattern),英文显然是两个词,但是,在实际使用过程中,却是比较混乱。虽然,我还不清楚厘清这两个词的关系,对基层的数学工作者有怎样的价值,但是至少对理解什么是数学是有益处的,能够帮助我们不止是了解数学的结论,而且了解数学的思考方法。 一、模型与数学模型 (一)模型的定义: 数学辞海第5卷第109页有关于模型的定义:模型原创 2016-01-16 11:05:30 · 24466 阅读 · 1 评论 -
Kernel density estimation 核密度估计
kernel density estimation是在概率论中用来估计未知的密度函数,属于非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基于数据集密度函数聚类算法提出修订的核密度估计方法。(先记录一下,下次再补全资料)原创 2015-11-10 22:22:08 · 17511 阅读 · 1 评论 -
贝叶斯网络(Bayesian Network)
贝叶斯网络贝叶斯网络(Bayesian Networks)也被称为信念网络(Belif Networks)或者因果网络(Causal Networks),是描述数据变量之间依赖关系的一种图形模式,是一种用来进行推理的模型。贝叶斯网络为人们提供了一种方便的框架结构来表示因果关系,这使得不确定性推理变得在逻辑上更为清晰、可理解性强。对于贝叶斯网络,我们可以用两种方法来看待它:首先贝叶斯网表达了各个节点间原创 2015-11-23 22:34:02 · 62868 阅读 · 10 评论 -
统计学第一类错误和第二类错误
统计学中存在两类错误这两类错误主要是在统计学假设检验中所出现的,因此,先要了解假设检验的基本概念。 假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0H_0;选取合适的统计量,这个统计量的选取要使得在假设H0H_0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显原创 2015-11-22 11:03:14 · 49313 阅读 · 1 评论 -
常用的数学古希腊字母 读法
标志读法:Αα alpha 角度;系数 Ββ beta 磁通系数;角度;系数 Γγ gamma 电导系数(小写) Δδ delta 变动;密度;屈光度 Εε,e epsilon 对数之基数 Ζζ zeta 系数;方位角;阻抗;相对粘度;原子序数 Ηη eta 磁滞系数;效率(小写)Θθ,θ theta温度;相位角 ∏π原创 2014-10-31 21:40:58 · 8304 阅读 · 0 评论 -
隐马尔可夫(HMM)举例讲解
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:Yang Eninala链接:http://www.zhihu.com/question/20962240/answer/33438846 来源:知乎隐马尔可夫(HMM)好讲,简单易懂不好讲。我认为 @者也的回答没什么错误,不过我想说个更通俗易懂的例子。我希望我的读者不是专家,而是对这个问题感兴趣转载 2015-10-28 10:42:46 · 3063 阅读 · 0 评论 -
聚类(clustering)与分类(Classification)的区别
当把聚类(Clustering)和分类(Classification)放到一起时,很容易弄混淆两者的概念,下分别对两个概念进行解释。 1 聚类(Clustering): 将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。 聚类分析的一般做法是,先确定聚类统计量,然后利用统计量对样品或者变量进行聚类。对N个样品进行聚类的方法称为Q型原创 2015-11-11 10:59:18 · 54109 阅读 · 1 评论 -
Markov-modulated Poisson process 马氏泊松过程
MMPP非齐次泊松过程,其强调变量服从马氏过程 一个双重随机过程:表现在测值特征的非齐次泊松过程;表现在该泊松过程密度变化转移特征的时间连续的马氏过程Markov-modulated泊松过程模型描述令{Xt}\{X_t\}是一个连续时间的马氏过程,状态空间为 S=(1,...,k)S=(1,...,k) 且{XtX_t}有无穷小转移概率矩阵Q={qij}Q=\{q_{ij}\}原创 2015-08-11 17:16:45 · 3764 阅读 · 0 评论 -
隐马尔科夫(Hidden Markov Model,HMM)详解
隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下,加深理解,在此特别感谢 52nlp 对 HMM 的详细介绍。 考虑下面交通灯的转载 2015-08-11 17:29:58 · 7743 阅读 · 0 评论 -
Poisson process泊松过程
一种累计随机事件发生次数的最基本的独立增量过程。 例如随着时间增长累计某电话交换台收到的呼唤次数,就构成一个泊松过程。 泊松过程是由法国著名数学家泊松(Poisson, Simeon-Denis)(1781—1840)证明的。 1943年C.帕尔姆在电话业务问题的研究中运用了这一过程,后来Α.Я.辛钦于50年代在服务系统的研究中又进一步发展了它。初级书转载 2015-08-11 16:49:29 · 6957 阅读 · 0 评论 -
状态转移矩阵(status transition matrix )
转移概率矩阵(又叫跃迁矩阵,英文名:transition matrix)是俄国数学家马尔科夫提出的,他在20世纪初发现:一个系统的某些因素在转移中,第n次结果只受第n-1的结果影响,即只与当前所处状态有关,而与过去状态无关。 在马尔科夫分析中,引入状态转移这个概念。所谓状态是指客观事物可能出现或存在的状态;状态转移是指客观事物由一种状态转移到另一种状态的概率。例如对应于一个天气预报的问题,若天气状态原创 2015-11-20 17:23:44 · 48506 阅读 · 2 评论