1. 概述
在机器学习中,采用概率视角来理解数据特征,比较常用的有多种概率分布函数,本文对其作基本的总结。具体而言,主要有均匀分布、高斯分布、伯努利分布、泊松分布、二项分布、多项式分布、贝塔分布、贝塔-二项分布、负二项分布、狄里克雷分布,伽马分布等。
2. 概率分布函数
按随机变量的所属类型即离散型和连续型,概率分布分为离散型随机变量概率分布和连续型变量概率分布。
2.1 离散型概率分布
2.1.1 二项分布(Binomial Distribution)
想象投掷一枚硬币n次,令变量表示头朝上出现的次数,如果定义参数
为单次投掷硬币头朝上的概率,则称
服从二项分布,表示为