19、数据探索与分析：感知腐败与童工率的关联研究

最新推荐文章于 2025-11-15 19:24:45 发布

熬夜协会会长

最新推荐文章于 2025-11-15 19:24:45 发布

阅读量12

点赞数

CC 4.0 BY-SA版权

分类专栏：用Python解锁数据的力量文章标签：数据探索皮尔逊相关性异常值分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/tcp8optimizer/article/details/154112147

用Python解锁数据的力量专栏收录该内容

40 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据探索与分析：感知腐败与童工率的关联研究

1. 数据初步观察

当查看列名时，我们发现新表包含了两个原始表的所有列。简单统计数据行数为 93 行，但实际上我们并不需要所有的数据点（原始表 pci_table 有 177 行，ranked 有 108 行），我们更关注数据之间的关联。对新表按 CPI 分数排序并取前 10 行后，得到如下有趣信息：
| 国家 | CPI 分数 - 童工率 |
| — | — |
| 阿富汗 | 8.0 - 10.3% |
| 索马里 | 8.0 - 49.0% |
| 伊拉克 | 16.0 - 4.7% |
| 也门 | 18.0 - 22.7% |
| 乍得 | 19.0 - 26.1% |
| 赤道几内亚 | 19.0 - 27.8% |
| 几内亚比绍 | 19.0 - 38.0% |
| 海地 | 19.0 - 24.4% |
| 柬埔寨 | 20.0 - 18.3% |
| 布隆迪 | 21.0 - 26.3% |

除伊拉克和阿富汗外，CPI 分数极低（即腐败感知程度高）的国家存在较高的童工率。我们可以使用 agate 库的内置方法来研究数据集中的这种关联。

2. 识别相关性

2.1 皮尔逊相关性分析

我们想确定政府腐败感知与童工率是否相关，首先使用简单的皮尔逊相关性分析。由于 agate 库正在将此相关性功能集成到 agate - stats 库中，目前我们可以使用 numpy 进行计算。

操作步骤如下：
1. 若未安装 numpy，运行

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。