以 1953 年、1964 年、1982 年、1990 年、2000 年、2010 年和 2020 年进行过的七次全国人口普查总人数为基础,再从国家统计局网站(国家统计局>>统计数据)获取从 1949 年到 2020 年的数据。本文采用 pandas 库对相关数据进行处理,使用 pytorch 框架搭建神经网络预测 2030 年全国人口普查总人数。
为方便演示,本例子选择考虑“人均 GDP ”和“受教育年限”作为影响总人口数的两个特征。观察数据,图左 为 1949-2020 年历年总人口数据,图中 为 1989-2017 年人均 GDP,图右 为 1989-2017 年人均受教育年限。



计算历年人口数量与人均GDP、人均受教育年限的皮尔逊相关系数判断其中的相关性。
| 年份 | GDP | 受教育年限 | |
|---|---|---|---|
| 年份 | 1.000000 | 0.912819 | 0.939085 |
| GDP | 0.912819 | 1.000000 | 0.885052 |
| 受教育年限 | 0.939085 | 0.885052 | 1.000000 |
如表中相关系数可知,人口数量与人均GDP、人口数量与人均受教育年限都具有相关性,因此可以使用人均GDP和人均

本文利用pandas处理数据,通过pytorch建立神经网络模型,基于历史人口、人均GDP和受教育年限预测2030年全国人口总数,预测结果为144716.5万人,显示人口增长率逐渐下降。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



