Pandas统计分析基础(4):DataFrame的数据分析及画图功能(case:京津冀地区的gdp和人口的关系)

✅作者简介:大家好我是Xlong,一枚正在学习COMSOL、Python的工科研究僧
📃个人主页:  Xlong的个人博客主页
🔥系列专栏:   Python大数据分析
💖如果觉得博主的文章还不错的话,请👍支持一下博主哦🤞

        在上篇文章中主要介绍了DataFrame中元素的增、删、改、查等基本功能,本篇文章主要是DataFrame的数据分析及画图功能的介绍。

目录

一、DataFrame的数据分析功能

1.1.读取output.xlsx文件中的sheet1 (gdp数据)

1.2 求每个地区的gdp平均值

1.3 每年全国总体gdp

1.4 快速查看每列数据的统计信息

 二、 利用DataFrame画图

2.1 折线图 

2.2 柱状图


一、DataFrame的数据分析功能

用上篇文章中导出的数据文件(output.xlsx)进行演示

1.1.读取output.xlsx文件中的sheet1 (gdp数据)

import pandas as pd
excelFile = r'output.xlsx'
df = pd.DataFrame(pd.read_excel(excelFile,sheet_name=0,index_col=0))#index_col=0,,可以去掉没意义的第一列标号和unnamed:0
print(df)

运行结果:

  北京市       天津市       河北省  ...      青海省  宁夏回族自治区  新疆维吾尔自治区
2018年  30319.98  18809.64  36010.27  ...  2865.23  3705.18  12199.08
2017年  28014.94  18549.19  34016.32  ...  2624.83  3443.56  10881.96
2016年  25669.13  17885.39  32070.45  ...  2572.49  3168.59   9649.70
2015年  23014.59  16538.19  29806.11  ...  2417.05  2911.77   9324.80
2014年  21330.83  15726.93  29421.15  ...  2303.32  2752.10   9273.46
2013年  19800.81  14442.01  28442.95  ...  2122.06  2577.57   8443.84
2012年  17879.40  12893.88  26575.01  ...  1893.54  2341.29   7505.31
2011年  16251.93  11307.28  24515.76  ...  1670.44  2102.21   6610.05
2010年  14113.58   9224.46  20394.26  ...  1350.43  1689.65   5437.47
2009年  12153.03   7521.85  17235.48  ...  1081.27  1353.31   4277.05
2008年  11115.00   6719.01  16011.97  ...  1018.62  1203.92   4183.21
2007年   9846.81   5252.76  13607.32  ...   797.35   919.11   3523.16
2006年   8117.78   4462.74  11467.60  ...   648.50   725.90   3045.26
2005年   6969.52   3905.64  10012.11  ...   543.32   612.61   2604.19
2004年   6033.21   3110.97   8477.63  ...   466.10   537.11   2209.09
2003年   5007.21   2578.03   6921.29  ...   390.20   445.36   1886.35
2002年   4315.00   2150.76   6018.28  ...   340.65   377.16   1612.65
2001年   3707.96   1919.09   5516.76  ...   300.13   337.44   1491.60
2000年   3161.66   1701.88   5043.96  ...   263.68   295.02   1363.56

[19 rows x 31 columns]

1.2 求每个地区的gdp平均值

import pandas as pd
excelFile = r'output.xlsx'
df = pd.DataFrame(pd.read_excel(excelFile,sheet_name=0,index_col=0))#index_col=0,,可以去掉没意义的第一列标号和unnamed:0
print(df.mean(numeric_only=None))#是针对每一列去操作

运行结果:

北京市         14043.282632
天津市          9194.721053
河北省         19029.720000
山西省          8346.071579
内蒙古自治区      10004.022105
辽宁省         16118.040000
吉林省          8209.141579
黑龙江省         9662.531579
上海市         16340.200000
江苏省         41224.622632
浙江省         26604.160526
安徽省         12867.220526
福建省         15273.601579
江西省          9665.197895
山东省         37637.603158
河南

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Xlong~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值