python-pandas数据分析+案例分析

文章主要分析了汽车销售数据,包括各年度总销量、各车类级别销量的环比变化,以及车辆销售规模、价格区间市场份额的变化趋势。同时,也探讨了地质灾害背景下航空公司客户价值的处理,针对原始数据中的缺失值和异常值提出了相应处理策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

一、汽车销售数据可视化分析

1. 各年度汽车总销量及环比,各车类、级别车辆销量及环比

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']#解决中文乱码
plt.rcParams['axes.unicode_minus'] = False  #解决负号乱码

sale_data=pd.read_csv('car_selling_fact.csv',encoding='gbk',
                     parse_dates=['时间'],
                     index_col=0)
print(sale_data.head())

#提取年
sale_data['年份']=sale_data['时间'].dt.year
#计算各年总销量
sale_year=sale_data.groupby('年份')[['销量']].sum()
            销量
年份            
2015  	14594487
2016  	16952990
2017 	17576436
2018  	17568751
2019   	7464071
#计算环比数
sale_year['差分']=sale_year.diff()
            销量          差分
年份                        
2015 	 14594487         NaN
2016  	 16952990   2358503.0
2017  	 17576436    623446.0
2018  	 17568751     -7685.0
2019  	  7464071 -10104680.0
            销量          差分
sale_year['环比']=[None]+list(sale_year['差分'].values[1:]/sale_year['销量'].values[:-1])
print(sale_year)
        销量          差分        环比
年份                                  
2015  14594487         NaN       NaN
2016  16952990   2358503.0  0.161602
2017  17576436    623446.0  0.036775
2018  17568751     -7685.0 -0.000437
2019   7464071 -10104680.0 -0.575151
#画一个柱状图
fig=plt.figure(figsize=(6,4))
ax1=fig.add_subplot(1,1,1)
ax1.bar(sale_year.index,sale_year['销量'])
ax1.set_ylabel(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值