前言
嗨喽~大家好呀,这里是魔王呐 ❤ ~
今天案例难度指数: ☆☆☆
准备
环境使用:
-
Anaconda (python3.9)
–> 识别我们写的代码
开发工具:
-
jupyter notebook
–> 代码编辑功能敲代码的工具
相关模块:
-
pandas pyecharts
—> pip install 模块
一、什么是数据分析
明确目的–获得数据(爬虫,现有,公开的数据)–数据预处理——数据可视化——结论
二、步骤
-
读取数据
-
数据预处理
-
可视化
代码展示
导入模块
import pandas as pd
读取数据
df = pd.read_html('http://tjj.hunan.gov.cn/hntj/ttxw/202105/t20210519_19050124.html')
df = df[0]
df
数据清洗
-
删除 del remove drop()
-
重命名列索引字段 热,rename()
重命名
df = df.rename(columns={
0:'城市',1:'人口数',2:'城市比重',3: