什么是“扩散概率”（diffuse probability）

dawningblue

于 2019-02-14 12:15:34 发布

阅读量3.4k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： CS231n 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/dawningblue/article/details/87263016

CS231n 同时被 2 个专栏收录

11 篇文章

订阅专栏

10 篇文章

订阅专栏

本文探讨了在CS231n课程中出现的diffuseprobability概念，即diffuseprior，解释其作为Uninformativepriors（非信息先验）在先验概率中的角色。文章深入分析了无差别原则，并从信息论角度，通过最大熵原则阐述了如何确定最优的先验概率分布。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天在看CS231n的时候看到了一个名词“diffuse probability”，扩散概率，Google了一下，在英文里直接定位到先验分布，用中文“扩散概率”查，有少数文献提到“扩散先验”
其实“diffuse probability”就应该是“diffuse prior”，diffuse prior 也称之为 Uninformative priors （非信息先验），是先验概率的一种形式，
关于设置 diffuse prior 的原则有很多（其实也不是很多），但是最古老也是最经典的是“无差别原则”，也就是对所有的可能出现的情况分配一个均等的概率。从信息论（最大熵原则）的观点出发其实也可以证明这点。对于系统来说，如果它揭露出的信息越少那么它的熵就越大。因此如果我们想在X上寻找一组熵最大的分布，这样过的分布是满足约束条件下所包含信息最少的。对于离散的概率分布，我们会为每一种可能的状态分配一个相等的先验概率。对于连续概率分布，当概率密度归一化为均值为零且方差为1时，使熵最大先验就是标准高斯分布。

参考文档：Prior probability

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。