数据分析作业六

最新推荐文章于 2021-10-18 12:19:04 发布

- 白鹿 -

最新推荐文章于 2021-10-18 12:19:04 发布

阅读量559

点赞数

分类专栏： python 习题笔记

本文链接：https://blog.youkuaiyun.com/weixin_55742843/article/details/119639628

版权

python 习题笔记专栏收录该内容

15 篇文章

订阅专栏

作业题目

拼接多个csv文件
去除重复数据，重新索引
自动挡和手动挡数目
计算每个城市二手车数量
统计每个汽车品牌平均售价价格(不是原价) (提示：groupby，可以先不做)

答案

拼接多个csv文件

代码

import numpy as np
import pandas as pd
csv_1 = pd.read_csv('../学习数据/guazi_bj.csv', encoding='utf-8', engine='python')  # 北京
csv_2 = pd.read_csv('../学习数据/guazi_gz.csv', encoding='utf-8', engine='python')  # 广州
csv_3 = pd.read_csv('../学习数据/guazi_sh.csv', encoding='utf-8', engine='python')  # 上海
csv_4 = pd.read_csv('../学习数据/guazi_sz.csv', encoding='utf-8', engine='python')  # 深圳
data = pd.concat([csv_1, csv_2, csv_3, csv_4])
data

执行效果

去除重复数据，重新索引

代码

data.drop_duplicates()
data.reset_index(drop=True)

执行效果

自动挡和手动挡数目

代码

a = data['speedbox'] == '自动'
print(a.sum())
b = data['speedbox'] == '手动'
b.sum()

执行效果

计算每个城市二手车数量

代码

# 北京 = 1539
c = csv_1.drop_duplicates()
c.info()
# -----------------------------------
# 广州 = 2007
d = csv_2.drop_duplicates()
d.info()
# ----------------------------------
# 上海 = 1937
e = csv_3.drop_duplicates()
e.info()
# ---------------------------------
# 深圳 = 1497
f = csv_4.drop_duplicates()
f.info()

执行效果

统计每个汽车品牌平均售价价格(不是原价) (提示：groupby，可以先不做)

代码

data_1 = data.groupby('brand')[['es_price']].mean()
data_1.head()

数据分析作业六

目录

作业题目

答案

拼接多个csv文件

代码

执行效果

去除重复数据，重新索引

代码

执行效果

自动挡和手动挡数目

代码

执行效果

计算每个城市二手车数量

代码

执行效果

统计每个汽车品牌平均售价价格(不是原价) (提示：groupby，可以先不做)

代码

执行效果