
AI数学
文章平均质量分 75
AI数学
长沙有肥鱼
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
无迹卡尔曼滤波(UKF)推导
提出,使用了一种不同的方法来计算误差协方差矩阵。它不使用(连续时间)黎卡提方程(Riccati Equations,形如。的一类非线性方程)或(离散时间)协方差传播和更新规律。关键的思想是基于一组特殊的样本点来估计误差协方差,这些点被称为。无迹卡尔曼滤波(Unscented Kalman Filter),最初由。点(Sigma Points),这些点直接通过原始非线性模型传播。无迹变换表示有三个特殊样本点的高斯分布,称为。原创 2024-04-03 10:15:41 · 1190 阅读 · 2 评论 -
贝叶斯分析与建模
贝叶斯分析一句话解释经典的概率论对小样本事件并不能进行准确的评估,若想的到相对准确的结论往往需要大量的现场实验;而贝叶斯理论能较好的解决这一问题,利用已有的先验信息,可以得到分析对象准确的后验分布,贝叶斯模型是用参数来描述的,并且用概率分布描述这些参数的不确定性。贝叶斯分析的思路由证据的积累来推测一个事物发生的概率, 它告诉我们当我们要预测一个事物需要的是首先根据已有的经验和知识推断一个先验概率, 然后在新证据不断积累的情况下调整这个概率。整个通过积累证据来得到一个事件发生概率的过程我们称为贝.原创 2022-02-18 16:27:21 · 5192 阅读 · 1 评论 -
聚类算法(python)
data.txtname calories sodium alcohol costBudweiser 144 15 4.7 0.43Schlitz 151 19 4.9 0.43Lowenbrau 157 15 0.9 0.48Kronenbourg 170 7 5.2 0.73Heineken 152 11 5.0 0.77Old_Milwaukee 145 23 4.6 0.28Augsberger 175 24 5.5 0.40Srohs_Bohemian_Style 149 .原创 2022-02-17 14:45:31 · 818 阅读 · 1 评论 -
DBSCAN算法
基本概念(Density-Based SpatialClusting of Applications with Noise)核心对象:若某个点的密度达到算法设定的阈值则其为核心点。(即r邻域内点的数量不小于minPts)原创 2022-02-16 22:21:26 · 1102 阅读 · 0 评论 -
K-MEANS算法
聚类概念:无监督问题:我们手里没有标签聚类:相似的东西分到一组难点:如何评估,如何调参基本概念:(1)要得到簇的个数许哟按指定K值(2)质心:均值,即向量各维取平均即可(3)距离的常量:常用欧几里得距离和余弦相似度(先标准化)(4)优化目标: 优势:简单,快速,适合常规数据集劣势:K值难确定复杂度与样本呈线性关系很难发现任意现状的簇python实例:...原创 2022-02-16 16:03:02 · 1143 阅读 · 1 评论 -
层次聚类和实例分析
层次聚类层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法。作为一家公司的人力资源部经理,你可以把所有的雇员组织成较大的簇,如主管、经理和职员;然后你可以进一步划分为较小的簇,例如,职员簇可以进一步划分为子簇:高级职员,一般职员和实习人员。所有的这些簇形成了层次结构,可以很容易地对各层次上的数.原创 2022-02-16 11:24:09 · 6843 阅读 · 0 评论 -
方差分析总结
方差分析检验多个总体均值是否相等,通过分析察数据的误差判断各总体均值是否相等实例:为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共23家企业投诉的次数如下表要做的事:分析四个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响如果它们的均值相等,就意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;如果均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的...原创 2022-02-14 22:32:06 · 7099 阅读 · 0 评论 -
相关分析总结
相关分析相关分析:衡量事物之间或称变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。 比如,家庭收入和支出、一个人所受教育程度与其收入、子女身高和父母身高等相关系数:衡量变量之间相关程度的一个量值 相关系数r的数值范围是在一1到十1之间 相关系数r的正负号表示变化方向。“+”号表示变化方向一致,即正相关;“-”号表示变化方向相反,即负相关 r的绝对值表示变量之间的密切程度(即强度)。绝对值越接近1,表示两个变量之间关系越密切;越接近0,表示两个变量之间关系越不密切 相关.原创 2022-02-14 15:34:17 · 4080 阅读 · 0 评论 -
卡方检验实例(python)
白人和黑人在求职路上会有种族的歧视吗?import pandas as pdimport numpy as npfrom scipy import statsdata = pd.io.stata.read_stata('us_job_market_discrimination.dta')data.head()blacks = data[data.race == 'b']whites = data[data.race == 'w']black的数据:whites.call.d.原创 2022-02-13 14:45:54 · 1156 阅读 · 2 评论 -
假设检验实例(python)
数据集下载地址:Journal of Statistics Education - Data Archive 用ctrl+F键搜索normtemp下载txt文件数据集描述:http://ww2.amstat.org/publications/jse/datasets/normtemp.txt 包括130条记录,我们主要利用体温和性别来进行实验import pandas as pdimport pylabimport mathimport numpy a...原创 2022-02-13 14:21:45 · 1966 阅读 · 3 评论 -
假设检验总结
假设检验: 什么是假设:对总体参数(均值,比例等)的具体数值所作的陈述。比如,我认为新的配方的药效要比原来的更好。 什么是假设检验:先对总体的参数提出某种假设,然后利用样本的信息判断假设是否成立的过程。比如,上面的假设我是要接受还是拒绝呢。 假设检验的应用: 推广新的教育方案后,教学效果是否有所提高 醉驾判定为刑事犯罪后是否会使得交通事故减少 男生和女生在选文理科时是否存在性别因素影响 假设检验的基本思想:显著性水平: ..原创 2022-02-12 23:34:37 · 4018 阅读 · 7 评论 -
ModuleNotFoundError: No module named ‘missingno‘
在Anoconda Prompt(Anoconda Prompt)中安装missingnopip install missingno用下面的指令查看是否安装成功:conda list原创 2022-02-12 20:44:21 · 5417 阅读 · 0 评论 -
回归分析python
构造随机数组:import numpy as npimport matplotlib.pyplot as pltimport statsmodels.api as smnsample = 20x = np.linspace(0, 10, nsample)xarray([ 0. , 0.52631579, 1.05263158, 1.57894737, 2.10526316, 2.63157895, 3.15789474, 3.68421053原创 2022-02-12 15:58:56 · 1272 阅读 · 0 评论 -
回归分析简介
回归分析相关分析是研究两个或两个以上的变量之间相关程度及大小的一种统计方法回归分析是寻找存在相关关系的变量间的数学表达式,并进行统计推断的一种统计方法在对回归分析进行分类时,主要有两种分类方式: 根据变量的数目,可以分类一元回归、多元回归 根据自变量与因变量的表现形式,分为线性与非线性 所以,回归分析包括四个方向:一元线性回归分析、多元线性回归分析、一元非线性回归分析、多元非线性回归分析。回归分析的一般步骤:一元线性回归: 因变量..原创 2022-02-12 10:46:35 · 3130 阅读 · 0 评论 -
Beta分布(Beta Distribution)
定义:beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所有概率出现的可能性大小。举一个简单的例子,熟悉棒球运动的都知道有一个指标就是棒球击球率(batting average),就是用一个运动员击中的球数除以击球的总数,我们一般认为0.266是正常水平的击球率,而如果击球率高达0.3就被认为是非常优秀的。现在有一个棒球运动员,我们希望能够预测他在这一赛季中的棒球击球率是多少。你可能就会直接计算棒球击球率,用击中的数除以击球数,但是如果这个棒球运动员只打了一次原创 2022-02-11 10:22:04 · 3405 阅读 · 0 评论 -
卡方分布(Chi-Squared Distribution)
定义通俗的说就是通过小数量的样本容量去预估总体容量的分布情况卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)卡方检验的基本思想是根据样本数据推断总体的频次与期望频次是否有显著性差异公式: ...原创 2022-02-11 09:19:11 · 4544 阅读 · 0 评论 -
均匀分布(Uniform distribution)
定义对于投骰子来说,结果是1到6。得到任何一个结果的概率是相等的,这就是均匀分布的基础。与伯努利分布不同,均匀分布的所有可能结果的n个数也是相等的。如果变量X是均匀分布的,则密度函数可以表示为:你可以看到,均匀分布曲线的形状是一个矩形,这也是均匀分布又称为矩形分布的原因。其中,a和b是参数。花店每天销售的花束数量是均匀分布的,最多为40,最少为10。我们来计算一下日销售量在15到30之间的概率。日销售量在15到30之间的概率为(30-15)*(1/(40-10)) = 0.5原创 2022-02-11 08:48:10 · 13239 阅读 · 2 评论 -
泊松分布(Poisson Distribution)
定义:现实生活多数服从于泊松分布假设你在一个呼叫中心工作,一天里你大概会接到多少个电话?它可以是任何一个数字。现在,呼叫中心一天的呼叫总数可以用泊松分布来建模。这里有一些例子:医院在一天内录制的紧急电话的数量。 某个地区在一天内报告的失窃的数量。 在一小时内抵达沙龙的客户人数。 书中每一页打印错误的数量。 泊松分布适用于在随机时间和空间上发生事件的情况,其中,我们只关注事件发生的次数。当以下假设有效时,则称为泊松分布任何一个成功的事件都不应该影响另一个成功的事件。 在短时间原创 2022-02-10 22:47:12 · 37757 阅读 · 2 评论 -
二项式分布(Binomial Distribution)
定义让我们来看看玩板球这个例子。假设你今天赢了一场比赛,这表示一个成功的事件。你再比了一场,但你输了。如果你今天赢了一场比赛,但这并不表示你明天肯定会赢。我们来分配一个随机变量X,用于表示赢得的次数。 X可能的值是多少呢?它可以是任意值,这取决于你掷硬币的次数。只有两种可能的结果,成功和失败。因此,成功的概率 = 0.5,失败的概率可以很容易地计算得到:q = p – 1 = 0.5。二项式分布就是只有两个可能结果的分布,比如成功或失败、得到或者丢失、赢或败,每一次尝试成功和失败的概率相等。原创 2022-02-10 21:33:27 · 8240 阅读 · 0 评论 -
正态分布(用python画出相应的图)
正态分布正态分布代表了宇宙中大多数情况的运转状态。大量的随机变量被证明是正态分布的。若随机变量X服从一个数学期望为???? 、方差为????^2的正态分布,记为N(???? ,????^2)。其概率密度函数为正态分布的期望值???? 决定了其位置,其标准差????决定了分布的幅度。当???? = 0,???? = 1时的正态分布是标准正态分布。公式为: ???? 是均值 ...原创 2022-02-10 20:11:04 · 8401 阅读 · 0 评论