Python进阶(十一)】—— Pandas和Seaborn可视化

🍉优快云小墨&晓末:https://blog.youkuaiyun.com/jd1813346972

   个人介绍: 研一|统计学|干货分享
         擅长Python、Matlab、R等主流编程软件
         累计十余项国家级比赛奖项,参与研究经费10w、40w级横向

【Python进阶(十一)】—— Pandas和Seaborn可视化,建议收藏!


该篇文章主要讲解了Python的Pandas和Seaborn可视化,通过实例演示对Pandas和Seaborn绘图方法进行熟悉,演示了常见绘图图形:折线图、核密度图等,同时部分图形进行美化。

1 Pandas和Seaborn可视化

  上一节我们演示了Matplotlib基础可视化,这一节,我们将进一步探索Python中另外两个强大的可视化工具:Pandas和Seaborn,它们各自在数据处理和美化图表方面有着独特的优势。

Pandas绘图的优势:

  1. 集成性:Pandas的绘图功能紧密集成在其DataFrame和Series对象上,使得数据分析和可视化可以无缝衔接。用户可以直接在数据处理后,利用Pandas的绘图函数快速生成图表,无需将数据转换到其他可视化库中。
  2. 便捷性:Pandas提供了多种快速生成图表的函数,如.plot(), .hist(), .boxplot()等,这些函数默认参数就能满足大部分基础需求,同时也支持高度自定义,以满足复杂的数据可视化需求。
  3. 灵活性:Pandas的绘图功能基于matplotlib构建,因此用户可以轻松地将matplotlib的样式和功能应用到Pandas生成的图表上,实现图表的美化和功能的扩展。
  4. 数据驱动的绘图:Pandas的绘图功能是基于数据的,它会自动处理数据索引、标签等,使得绘图过程更加直观和方便。用户无需手动设置图表的x轴、y轴标签等,这些都会根据DataFrame或Series的索引和列名自动生成。

Seaborn绘图的优势:

  1. 统计绘图:Seaborn是一个基于matplotlib的高级绘图库,它提供了更多面向统计学的绘图功能,如分布图、关系图、时间序列图等。这些功能使得Seaborn特别适合用于数据分析和统计建模的可视化。
  2. 美化效果:Seaborn通过提供丰富的样式和颜色主题,以及自动调整图表的美学参数(如字体大小、颜色搭配等),使得生成的图表更加美观和具有吸引力。这有助于在报告和演示中更好地展示数据。
  3. 集成性:尽管Seaborn是基于matplotlib构建的,但它提供了更高级别的接口,使得用户可以用更少的代码实现更复杂的数据可视化。同时,Seaborn也支持与Pandas的DataFrame对象直接交互,进一步增强了其集成性和便捷性。
  4. 数据探索:Seaborn的绘图功能特别适合用于数据探索,它可以帮助用户快速发现数据中的模式和关系。通过生成各种统计图表,用户可以直观地了解数据的分布情况、相关性等,从而为后续的数据分析和建模提供有力支持。

  综上所述,Pandas和Seaborn在绘图方面各有优势,Pandas更适合于快速生成基础图表和数据处理后的即时可视化,而Seaborn则更适合于统计绘图、数据探索和生成美观的图表。在实际应用中,用户可以根据具体需求选择适合的库进行可视化操作。

2 Pandas可视化

  运行程序:

import pandas as pd 
women = pd.read_csv('women.csv',index_col =0)  
women.plot(kind="bar")#柱状图
plt.show()

women.plot(kind="barh") #横向柱状图
plt.show() 

women.plot(kind="bar",x="height",y="weight",color="g") #横轴为身高,纵轴为体重,颜色为g
plt.show()

women.plot(kind="kde")#核密度估计曲线
plt.show()

women.plot(kind="bar",x="height",y="weight",color="g") 
plt.legend(loc="best")#图例位置为“最优”
plt.show()

  运行结果:

3 Seaborn可视化

3.1 折线图

  运行程序:

#导入包
import matplotlib.pyplot as plt 
plt.style.use("classic")
%matplotlib inline

#数据准备
import numpy as np
import pandas as pd
rng= np.random.RandomState(0)
x=np.linspace(0,10,500) 
y=np.cumsum(rng.randn(500,6),0) #计算各行数组累加值
plt.plot(x,y)
plt.legend("abcded",ncol=2,loc="upper left")

  运行结果:

  运行程序:

import seaborn as sns#seaborn绘图更加美观
sns.set()
plt.plot(x,y)
plt.legend("abcdef",ncol=2,loc="upper left")#设置图例参数;ncol:图例列数

  运行结果:

3.2 核密度图

  运行程序:

sns.kdeplot(women.height, shade=True) #核密度估计图  

  运行结果:

  运行程序:

sns.distplot(women.height)#displot图:直方图+kdeplot图

  运行结果:

3.3 散点图矩阵

  运行程序:

sns.pairplot(women)  #绘制散点图矩阵

  运行结果:

3.4 联合分布图

  运行程序:

sns.jointplot(women.height,women.weight,kind="reg")#联合分布图

  运行结果:

  运行程序:

with sns.axes_style("white"):
    sns.jointplot(women.height,women.weight,kind="reg")#加入with语句,使设置更美观

  运行结果:

3.5 直方图

  运行程序:

for x in ["height","weight"]:
    plt.hist(women[x],normed=True,alpha=0.5)#利用循环绘制直方图

  运行结果:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

傩戏焕彩

谢谢老板帮助充电!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值