贝叶斯概率

贝叶斯概率概述

贝叶斯概率是由贝叶斯理论所提供的一种对概率的解释,它采用将概率定义为某人对一个命题信任的程度的概念。贝叶斯理论同时也建议贝叶斯定理可以用作根据新的信息导出或者更新现有的置信度的规则。

1、 贝叶斯概率和频率概率

贝叶斯概率和频率概率相对,它从确定的分布中观测到的频率或者在样本空间中的比例来导出概率。  贝叶斯学派和频率学派在概率解释上的分歧在统计学实践上有重要的结果。

例如,在用同样的数据比较两个假设的时候,假设测试理论基于概率的频率解释,它允许基于错误推出数据更支持另外那个模型/假设的概率来否定或接受一个模型/假设(零假设)。出现这种错误的概率称为一类误差,它要求考虑从同样的数据源导出的假想的数据集合要比实际观测到的数据更为极端。这个方法允许论断或者'两个假设不同或者观测到的数据是误导性的集合'。相对应的是,贝叶斯方法基于实际观测到的数据,因此能够对于任何数量的假设直接赋予后验概率。对于代表每个假设的模型的参数必须赋予概率的要求是这种直接方法的代价。

2、 贝叶斯概率的应用

  自1950年代以来,贝叶斯理论和贝叶斯概率通过考克斯定理、Jaynes的最大熵原理以及荷兰书论证得到了广泛的应用。在很多应用中,贝叶斯方法更为普适,也似乎较频率概率能得出更好的结果。贝叶斯因子也和奥卡姆剃刀一起使用。数学应用请参看贝叶斯推论和贝叶斯定理。

  有些人将贝叶斯推论视为科学方法的一种应用,因为通过贝叶斯推论来更新概率要求从对于不同假设的初始信任度出发,采集新的信息(例如通过做试验),然后根据新的信息调整原有的信念。调整原有的信念可以意味着(更加接近)接受或者推翻初始的假设。

  贝叶斯技术最近被应用于垃圾邮件的过滤上。贝叶斯垃圾邮件过滤器采用电子邮件的一个参考集合来定义什么最初被认为是垃圾邮件。定义了参考之后,过滤器使用参考中的特点来将新的邮件判定为垃圾邮件或有效邮件。新电子邮件作为新的信息出现,并且如果用户在垃圾邮件和有效邮件的判定中发现错误,这个新的信息会更新初始参考集合中的信息以期将来的判定可以更为精确。参看贝叶斯推论和贝叶斯过滤。

Python中有多种贝叶斯分类算法库可供使用,如scikit-learn和nltk等。贝叶斯分类算法的实现主要包括先验概率的计算和后验概率的计算。 贝叶斯分类算法中的先验概率是指在没有任何特征信息的情况下,每个类别发生的概率。可以使用训练数据集中每个类别的样本数量除以总样本数量来估计先验概率。 后验概率是指在已知特征的情况下,某个样本属于某个类别的概率。对于朴素贝叶斯分类算法,可以使用贝叶斯公式来计算后验概率贝叶斯公式通过先验概率和条件概率的乘积来计算后验概率。 在伯努利朴素贝叶斯算法中,特征的先验概率被假设为二元独立分布。条件概率通过特征在每个类别中出现的频率来计算。 所以,Python中的贝叶斯概率计算可以通过使用相应的库和函数来实现。例如,使用scikit-learn库中的MultinomialNB类可以实现朴素贝叶斯分类算法,其中包括先验概率和后验概率的计算。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [机器学习之朴素贝叶斯算法原理+Python实现](https://blog.youkuaiyun.com/zcz0101/article/details/109577494)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值