基尼系数的计算原理

本文深入探讨了基尼系数的计算原理,从理论出发,解析了其在衡量不平等程度上的重要性。通过对数据的分析,揭示了基尼系数在经济学、社会学以及互联网领域的广泛应用。

理论

基尼指数( Gini Index 20世纪初经济学家基尼定义的指标,最为知名的应用是考察居民收入的差异情况。
居民收入的情况符合幂指函数( Power Law )分布,最直观(但非准确)的理解就是 80/20 原则,也就是 20%的人拥有了 80% 的人的财富。用公式表示就是
描述了是收入靠后 %x 的人所拥有的收入总和占所有人收入总和的比例 f(x) 的关系。
幂指函数还有很多非常牛逼的应用,比如如果将单词出现的频率按照由高到低排列,则每个单词出现的频率和它在热门排行榜中排名的常数次幂成反比。

由于一本《长尾理论》的出现,在互联网领域幂指分布也叫长尾分布,因为大概最热门的 20% 的商品占据了用户购买商品数的 80% 。我们将物品按照热门程度从低到高排列,那么下图中的曲线表示最不热门的 x% 物品的总流行度占系统的比例 y% 。这条曲线肯定是在 y=x曲线之下的,而且和 y=x 曲线相交在(0,0)  (1,1)

计算


基尼系数的计算公式为  ,也就是说,当收入很平均时,曲线接近于直线, A 的面积趋于0 ,基尼系统也趋于 0 

下面推导公式:


关键是求 S(B) ,把B 分成从 1 n 一共n 个小梯形,梯形的底为   ,高为 1/n,而 0   1,则:

可得基尼系数为:
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值