
概率论与数理统计
文章平均质量分 60
概率论与数理统计记载
微电子学与固体电子学-俞驰
如切如磋,如琢如磨,臻于至善。
展开
-
医学中何时运用单边置信和双边置信
比如血糖浓度,使用双边置信,因为人体的血糖不可能为0,也不能过高。比如乙肝病毒抗体浓度,使用单边置信,因为正常人体的该浓度可以为零。原创 2022-03-30 09:19:31 · 1161 阅读 · 0 评论 -
使用K-S检验一个数列是否服从正态分布、两个数列是否服从相同的分布(转载+自己笔记)
K-S检验全称:Kolmogorov-Smirnov检验下面内容来自[1]假设检验的基本思想: 若对总体的某个假设是真实的,那么不利于或者不能支持这一假设的事件A在一次试验中是几乎不可能发生的。如果事件A真的发生了,则有理由怀疑这一假设的真实性,从而拒绝该假设。实质分析: 假设检验实质上是对原假设是否正确进行检验,因此检验过程中要使原假设得到维护,...转载 2019-09-16 11:11:34 · 2397 阅读 · 0 评论 -
python卡方分布计算
根据p-value计算分位点import scipy.statsprint scipy.stats.chi2.ppf(0.05, 5)根据分位点计算p-valuefrom scipy import statsprint 1 - stats.chi2.cdf(critical_value, DF)原创 2018-11-28 20:48:12 · 6090 阅读 · 0 评论 -
The proof of “chi-square statistics follows chi-square distribution”
The target is to prove:∑i=1i=r∑j=1j=s[Xij−Ni⋅(Njn)]2Ni⋅(Njn)∼χ2[(r−1)(s−1)]①\sum_{i=1}^{i=r} \sum_{j=1}^{j=s}\frac{[X_{ij}-N_i·(\frac{N_j}{n})]^2}{N_i·(\frac{N_j}{n})}\sim\chi^2{[(r-1)(s-1)]}①i=1∑i...原创 2018-11-27 15:44:49 · 2035 阅读 · 4 评论 -
卡方检验contingency(列联表)python计算与实验结果分析
代码如下import numpy as npfrom scipy.stats import chi2_contingencyd = np.array([[37, 49, 23], [150, 100, 57]])print chi2_contingency(d)运行结果如下:(7.6919413561281065,0.021365652322337315,1.2,array(...原创 2018-11-29 20:16:48 · 5959 阅读 · 2 评论 -
详细解释到底啥是共轭先验(用本科知识来解释)
我们直奔主题。根据百度百科上的解释:如果后验分布与先验分布属于同类(分布簇),则先验分布与后验分布被称为共轭分布,而先验分布被称为似然函数的共轭先验。上面这个定义有点复杂,我们待会儿再回过头来看这个定义P(θ∣x)=P(x∣θ)⋅P(θ)∫P(x∣θ′)⋅P(θ′)dθ′P(\theta|x)=\frac{P(x|\theta)·P(\theta)}{\int P(x|\theta&am...原创 2018-11-16 19:50:37 · 7165 阅读 · 0 评论 -
为什么“极大似然估计表达式的极值”可以用来估计参数
极大似然估计,通俗理解来说,就是在假定整体模型分布已知,利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值!换句话说,极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。可能有小伙伴就要说了,还是有点抽象呀。我们这样想,一当模型满足某个分布,它的参数值我通过极大似然估计法求出来的话。比如正态分布中公式如下:如果我通过极大似然估...转载 2018-10-02 20:48:10 · 2518 阅读 · 2 评论 -
根据数据集获取概率密度图像和概率分布图像
matlab代码如下:number=10000data=randn(number,1);[y,x]=hist(data,100); %分为100个区间统计,(你可以改你需要的区间数)% y=y/length(data)/mean(diff(x)); %计算概率密度 ,频数除以数据种数,除以组距y=y/numberfigure(1)bar(x,y,1); ...原创 2018-07-07 18:35:10 · 4517 阅读 · 0 评论 -
到底什么是逆累积分布函数?
其实国内翻译很有问题,反函数里面的"反",对应的英文单词是inverse逆累积分布函数里面的"逆",对应的英文单词是inverse所以“逆累积分布函数”的意思其实是“反累积分布函数”作用:求分位点matlab代码如下:mu = 0;sigma = 1;pd = makedist('Normal',mu,sigma);p = [0.1,0.25,0.5,0....原创 2018-07-07 16:47:20 · 19483 阅读 · 9 评论 -
核密度估计Kernel Density Estimation(KDE)-代码详细解释
在介绍核密度评估Kernel Density Estimation(KDE)之前,先介绍下密度估计的问题。由给定样本集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一。解决这一问题的方法包括参数估计和非参数估计。(对于估计概率密度,如果确定数据服从的分布类型,可以使用参数拟合,否则只能使用非参数拟合)参数估计又可分为参数回归分析和参数判别分析。在参数回归分析中,人们假定数据分布...原创 2018-07-06 21:48:53 · 36778 阅读 · 43 评论 -
数据挖掘关联分析中的支持度、置信度和提升度
许多商业企业运营中的大量数据,通常称为购物篮事务(market basket transaction)。表中每一行对应一个事务,包含一个唯一标识TID。利用关联分析的方法可以发现联系如关联规则或频繁项集。二元表示每一行对应一个事务,每列对应一个项,项用二元变量表示项在事务中出现比不出现更重要,因此项是非对称的的二元变量。项集(Itemset):包含0个或多个项的集合,如果包...转载 2018-07-01 14:54:01 · 2609 阅读 · 2 评论 -
先验概率与后验概率、贝叶斯区别与联系
本文假设大家都知道什么叫条件概率了(P(A|B)表示在B事件发生的情况下,A事件发生的概率)。先验概率和后验概率教科书上的解释总是太绕了。其实举个例子大家就明白这两个东西了。假设我们出门堵车的可能因素有两个(就是假设而已,别当真):车辆太多和交通事故。堵车的概率就是先验概率。那么如果我们出门之前我们听到新闻说今天路上出了个交通事故,那么我们想算一下堵车的概率,这个就叫做条件概...转载 2018-07-05 17:25:18 · 23387 阅读 · 8 评论 -
泊松分布的来源—公式推导—应用
转载请注明:http://blog.youkuaiyun.com/ningyaliuhebei/article/details/46409215一。泊松分布由二项分布引出(二者都是离散型随机变量)首先必须由二项分布引出:如果做一件事情成功的概率是 p 的话,那么独立尝试做这件事情 n 次,成功次数的分布就符合二项分布。展开来说,在做的 n 次中,成功次数有可能是 0 次、1 次 …… n次。成功 i 次的概率...转载 2018-05-29 13:27:19 · 15263 阅读 · 0 评论 -
《概率论与数理统计习题全解指南》中的“计算机得”
对于t分布而言,有:下面演示如何计算出书中提到的0.0271http://www.osgeo.cn/app/sb137--------------------------------------------------------------------------------------------------------对于卡方分布而言,则有http://www.osgeo.cn/app/sb...原创 2018-04-05 22:23:33 · 685 阅读 · 0 评论 -
20%截尾均值计算
How to Find a Trimmed MeanExample: Find the trimmed 20% mean for the following test scores: 60, 81, 83, 91, 99.Step 1: Trim the top and bottom 20% from the data. That leaves us with the middle three v...转载 2018-04-16 21:26:26 · 6846 阅读 · 0 评论 -
强大数定律与弱大数定律的图示详解
代码来自:https://stats.stackexchange.com/questions/2230/convergence-in-probability-vs-almost-sure-convergence?noredirect=1&lq=1该链接中,下面是强大数定律的R语言代码:n <- 1000; m <- 50; e <- 0.05s <- cums...转载 2018-04-16 12:59:41 · 9275 阅读 · 0 评论