**
我国民生数据分析
**
以前做过一个项目是关于民生数据分析的:
民生问题是我们普通老百姓最关心的问题,国家只有改善民生,才能维护人民的根本利益,才能发展生产力,近年来国家不断加大对解决民生问题的力度,主要从就业、收入、社 保、住房、教育、医疗、脱贫等方面入手,这在我们生活中深有体会。 对民生数据进行研究分析也有助于我们了解国家
数据来源
这些关于民生的,在网上很难找到数据集
想要详细信息只能通过政府。。。
所以去政府网站找找吧,比如国家数据网站(http://data.stats.gov.cn/)
这是中华人民共和国国家统计局提供的数据查询网站,它发布有国内外各个方面的统计数据
获取方式
由于网页数据是以表格方式展示,格式也较为规整,而且可以直接下载或复制
因此直接复制粘贴到Excel表格中即可,而无需编写爬虫
这是网站的数据,可以看到,数据都很规整,直接复制粘贴出来就行
但是! 不要把所有指标的数据都放在同一个Sheets里,要分开放
数据指标
把想要的数据复制下来放进Excel不同的Sheets里
1、城镇人口(万人)
2、乡村人口(万人)
3、城市居民最低收入人数(万人)
4、农村居民最低收入人数(万人)
5、农村集中供养五保人数(万人)
6、农村分散供养五保人数(万人)
7、城乡居民社会养老保险参保人数(万人)
8、城乡居民社会养老保险实际领取待遇人数(万人)
9、地方财政一般预算支出(亿元)
10、地方财政教育支出(亿元)
11、地方财政社会保障和就业支出(亿元)
12、地方财政医疗卫生支出(亿元)
13、地方财政城乡社区事务支出(亿元
14、地方财政交通运输支出(亿元)
15、地方财政住房保障支出支出(亿元)
16、村卫生室个数(个)
17、互联网普及率(%)
18、社会福利企业(个)
19、铁路营业里程(万公里)
20、公路里程(万公里)
数据整理
因为数据中每个“年份”是以字段的形式存在,不利于在 Tableau 中处理
所以我编写了一个简单的 Python 脚本,把“年份”转置作为值来存储
import xlrd
import xlwt
reader = xlrd.open_workbook('D:/temp/来源.xlsx', encoding_override='gbk')
writer = xlwt.Workbook('gbk')
for sheet_src in reader.sheets():
sheet_dst = writer.add_sheet(sheet_src.name)
# 新的表头
sheet_dst.write(0, 0, sheet_src.cell(0, 0).value)
sheet_dst.write(0, 1, '年份')
sheet_dst.write(0, 2, sheet_src.name)
for local in range(1, sheet_src.nrows):
for year in range(1, sheet_src.ncols):
# 新的行号
row = (local - 1) * (sheet_src.ncols - 1) + year
# 新的数据
sheet_dst.write(row, 0, sheet_src.cell(local, 0).value)
sheet_dst.write(row, 1, sheet_src.cell(0, year).value)
sheet_dst.write(row, 2, sheet_src.cell(local, year).value)
writer.save('D:/temp/out.xls')
经过处理之后数据格式变成这样:
也就是说,年份单独变成一列,数值单独变成一列
这样方便来使用Tableau的处理与进行数据可视化分析
数据分析
分析出来挺多的
在这里我就简单列举几点就好了
1、各省铁路与公路里程历年变化分析
各省铁路运营里程在 2000 年都会有一定程度的下降,而之后一直在逐渐上升;公路里程每年都在上升,其中因为 05-06 年的政策原因,公路里程上升的趋势最快。俗话说:要致富先修路。这也说明了各省政府为了使人们的交通方式更方便快捷,每年都会加大力度增加铁路的营业里程与修建公路, 这也体现出各省政府正在通过多种方式来解决低收入与贫困问题
2、各省社会福利企业数量分析
由于政策原因,许多福利企业的积极性减少,小型福利企业运营不下去,所以各省的福利企业在逐年减少,这样的也能促使残疾人士以及贫困人士等转型,转向高科技、高技能的知识型
2、各省村卫生室数量分析
2003 年的数量是最低的,2003 至 2011 年数量有所上升,但是 2011 年之后开始下降,这说明地方卫生经费不足、村医待遇底下、农村城镇化等原因。2003 至 2011 年政府出力扶持农村卫生室,数量有所上升,但是始终也没能解决农村卫生室相对于2001年少了很多,从2011年开始又呈不断减少的趋势
3、各省互联网普及率分析
截止 2016 年,北京、上海、广东等地的互联网普及率相对较高,云南的互联网普及率排名最后。 互联网的普及促进了我国经济社会转型,成为改善民生、增进社会福祉的强力推进器。 互联网的普及可以加大加宽农民销售农产品的渠道,增加农民的收入,使贫困人口有效减少。(按右边的播放键可以动态查看分布数据的年度变化)
ps:我是说我的tableau工作簿可以播放,这里只是图片,当然播放不了
4、社会服务相关财政支出情况分析
各省扶贫相关财政支出占总支出的比例都较大,可以看出各省对民生方面的改善做出了很大的决心
各省每年住、行、医、保、教育、社区支出占总支出的比例,其中历年最高的支出是教育方面,最低的是住房保障方面,社会保障就业与城乡事务的支出也比较高,说明中国很重视教育与民生方面,这也是国家为什么进行全面扶贫,实行 9 年义务教育等政策的原因
总结
从分析这些数据得出来得结果中,可以知道,我国农村正在慢慢地城镇化,低收入人群正在不断地向高科技、高技能的知识型而转型;互联网正在不断向全国各地(包括农村地区)普及,每年的普及率都在上升!各省政府非常关注民生问题,每年都在增加对民生事业的资金投入, 不断地修建公路,加大铁路的运营里程等等,我们的国家正在不断地变好,不断地变强!
当然,这只是我简单例举出来的几个分析
其他详细的就不一个个地放上来了,太多也放不下啊哈哈哈哈
如果有不妥之处请大神们指教!