基尼系数与相关计算方法

原创于 2025-07-30 14:08:21 发布 · 938 阅读

CC 4.0 BY-SA版权

文章标签：

基尼系数 (Gini coefficient) 是衡量收入分配或财富分配不平等程度的常用指标。它通常介于 0 和 1 之间，0 表示完全平等（每个人拥有相同的收入或财富），1 表示完全不平等（所有收入或财富都集中在一个人手中）。

虽然基尼系数的定义是基于洛伦茨曲线 (Lorenz curve)，但在实际计算中，有几种常用的公式，它们本质上是等价的，但适用于不同类型的数据或计算场景。

这是基尼系数最直观的定义方式，基于洛伦茨曲线图。

洛伦茨曲线：将人口按收入从低到高排序，横轴表示人口的累计百分比，纵轴表示这部分人口所拥有的收入的累计百分比。如果收入完全平等，洛伦茨曲线将是一条 45 度对角线（称为绝对平等线）。实际的收入分配曲线会在这条对角线的下方。

公式：

其中：

因此，该公式也可以表示为：

区别： 这种公式是基尼系数的概念性定义，它强调基尼系数是洛伦茨曲线与绝对平等线之间面积占总面积的比例。它在理论分析和图示解释中非常有用，但在实际数据计算时，直接测量面积 A 和 B 往往需要积分或其他更复杂的数值方法。

当你有每个个体（或家庭）的收入数据时，可以使用这种公式。这种方法计算的是所有收入差异的平均值与总平均收入的比值。

假设有 n 个个体，他们的收入分别为 y1,y2,…,yn，且已经按非降序排列 (y1≤y2≤⋯≤yn)。

公式：

其中：

更常用的排序简化公式： 对于已排序的数据 (y1≤y2≤⋯≤yn)，可以简化为：

其中 i 是收入 yi 在排序后的排名（从 1 到 n）。

区别：

当数据以分组形式给出（例如，不同收入区间的家庭数量和其收入份额）时，可以使用梯形法来近似计算基尼系数。这实际上是洛伦茨曲线面积法的离散近似。

假设有 k 个收入组，每个组的人口比例为 pi，收入累计比例为 Yi (洛伦茨曲线上的点)。

公式： 通常表示为：

其中 Xi 是累计人口比例，Yi 是累计收入比例。通常设定 X0=0,Y0=0。

区别：