Python 中用matplotlib 画出 numpy.random.beta分布

Python 中用matplotlib 画出 numpy.random.beta分布

Background 背景说明

在学习中碰到beta分布, 刚好又在熟悉 numpy 以及 matplotlib 库,所以干脆就拿 matplotlib 实现 beta 分布作为练手

所以本篇文章主要包含以下几点:

  • 熟悉Beta分布
  • matplotlib 画 Beta分布图
  • matplotlib 各属性设置
  • matplotlib 支持中文标题

Β分布

Β分布

在概率论中,Β分布也称贝塔分布(Beta distribution),是指一组定义在{\displaystyle (0,1)}(0,1)区间的连续概率分布,有两个参数{\displaystyle \alpha ,\beta >0}\alpha ,\beta >0。

matplotlib 支持中文标题

Matplotlib 默认不支持中文,在title()中用中文标识时,只会出现一堆黑框

所以需要在 Matplotlib 添加字体支持

# 设置 plot 支持中文
from matplotlib.font_manager import FontProperties
font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)

完整代码

import numpy as np
from scipy.stats import beta
import matplotlib.pyplot as plot

# 设置 plot 支持中文
from matplotlib.font_manager import FontProperties
font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)

# 定义一组alpha 跟 beta值
alpha_beta_values = [[0.5,0.5], [5, 1], [1,3], [2,2], [2,5]]
linestyles = []

# 定义 x 值
x = np.linspace(0, 1, 1002)[1:-1]
for alpha_beta_value in alpha_beta_values:
  print(alpha_beta_value)
  dist = beta(alpha_beta_value[0], alpha_beta_value[1])
  dist_y = dist.pdf(x)
  # 添加图例
  # plot.legend('alpha=')
  # 创建 beta 曲线
  plot.plot(x, dist_y, label=r'$\alpha=%.1f,\ \beta=%.1f$' % (alpha_beta_value[0], alpha_beta_value[1]))

# 设置标题
plot.title(u'B分布', fontproperties=font)
# 设置 x,y 轴取值范围
plot.xlim(0, 1)
plot.ylim(0, 2.5)
plot.legend()
plot.show()

输出结果

20200511113010

<think>嗯,用户问的是numpy中的random.dirichlet函数的用法和介绍。首先,我需要回忆一下Dirichlet分布的基本概念。Dirichlet分布Beta分布在多维上的推广,通常用于表示多个变量之间的概率分布,比如多项分布的参数。它的参数是一个向量α,每个α分量决定了分布的形态。 接下来,我得确认numpy的官方文档中关于random.dirichlet的内容。函数的基本用法是生成符合Dirichlet分布的样本。参数包括alpha、size等。alpha参数是必须的,通常是一个正数的数组,表示分布的参数。size参数指定输的形状。返回的是一个和alpha形状相关的数组,每个元素的和为1,符合概率分布的要求。 然后,我需要考虑用户可能的应用场景。Dirichlet分布在自然语言处理中用于主题模型,比如LDA,或者在贝叶斯统计中作为先验分布。用户可能需要具体的例子来理解如何使用这个函数,比如生成三组概率分布,每组有三个概率值,这时候alpha参数可能设置为[1,1,1]或者其他值。 还要注意常见参数的使用方法,例如alpha的不同取值对生成样本的影响。当alpha的分量都相同时,分布是对称的;如果alpha中有分量大于1,分布会更集中;小于1的话会更分散。这些特性可能需要通过示例代码来展示。 另外,用户可能会遇到问题,比如alpha参数必须为正数,否则会报错。或者生成的样本形状是否符合预期。这时候需要提醒用户注意输入参数的合法性,并检查输结果的形状。 参考用户提供的引用内容,虽然主要是关于热力图和Pandas的切片,但可能用户在处理数据时需要使用Dirichlet分布生成模拟数据,比如在参数调优或可视化时。不过这些引用可能不直接相关,但需要确保回答中的示例代码正确,并且符合Pythonnumpy的最佳实践。 最后,生成相关问题需要考虑用户可能进一步想知道Dirichlet分布的应用场景、参数选择的影响,或者与其他分布的区别。比如Dirichlet和多元高斯分布的不同,或者如何调整alpha参数来满足特定需求。</think>### numpy.random.dirichlet 函数详解 #### 1. 函数定义 Dirichlet 分布Beta 分布的多维推广,常用于表示**多项分布的概率参数**。其概率密度函数为: $$f(x_1,...,x_k) = \frac{1}{B(\alpha)} \prod_{i=1}^{k} x_i^{\alpha_i -1}$$ 其中 $\alpha=(\alpha_1,...,\alpha_k)$ 是形状参数,$B(\alpha)$ 是多元Beta函数。 函数签名: ```python numpy.random.dirichlet(alpha, size=None) ``` #### 2. 参数说明 | 参数 | 类型 | 描述 | |------|------|------| | alpha | array-like | 分布参数(必须为正值) | | size | int/tuple | 输样本的维度 | #### 3. 返回值 返回形状为 `(size, k)` 的数组,其中 `k=len(alpha)`,每行数据满足: $$\sum_{i=1}^{k} x_i = 1$$ #### 4. 基础用法示例 ```python import numpy as np # 生成三组概率分布,每组包含3个概率值 alpha = [1, 1, 1] # 相当于均匀分布 samples = np.random.dirichlet(alpha, size=3) print(samples) ``` 输示例: ``` [[0.214 0.483 0.303] [0.331 0.412 0.257] [0.297 0.105 0.598]] ``` #### 5. 参数影响对比 | α值类型 | 生成样本特征 | 典型应用场景 | |---------|-------------|-------------| | α_i = 1 | 均匀分布 | 无先验信息时使用[^1] | | α_i > 1 | 集中分布 | 数据平滑处理 | | α_i < 1 | 稀疏分布 | 特征选择 | #### 6. 实际应用场景 ```python # 文本分类中的先验分布设置 topic_prior = np.random.dirichlet([0.1]*100, size=1) # 生成稀疏主题分布 print("最大概率主题:", np.argmax(topic_prior)) ``` #### 7. 注意事项 - 所有α参数必须 > 0 - 输维度为 `(size,) + alpha.shape` - 可通过`np.testing.assert_almost_equal(samples.sum(axis=-1), 1)`验证概率和
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值