上一章matplotlib的教程:
准备工作:
import……
这和上期用一样的数据集
一、线图
用到的函数:lmplot() reg()
这两个函数相似参数结构:(x=,y=,data=)是必选项
他们的优点是:会直接将变量名作为xy轴标签
不同点:lm可以取消回归线但不能取消散点,reg能取消散点但不能取消对称
这一不同点恰好体现了他们的侧重点
为了看清楚散点,我们只选取前100个
dta=data[0:100]
sns.lmplot(x='average_montly_hours',y='satisfaction_level',data=dta)
#必备的要素:x=,y=,data=,而且要写全
plt.title("都有") #仍然使用mat来编辑附件
plt.savefig("sns_lm_both",bbox_inches='tight')
#bbox_inches='tight' 让图片标题显示完
#猜测原因是mat与sns之间差异造成的
去掉回归线:
sns.lmplot(x='average_montly_hours',y='satisfaction_level',fit_reg=False,data=dta)
plt.title("fit_reg=False")
plt.savefig("sns_lm_sc",bbox_inches='tight')
regplot去掉散点:
sns.regplot(x='average_montly_hours',y='satisfaction_level',scatter=False,data=dta)
plt.title("scatter=False")
plt.savefig("sns_reg_sc",bbox_inches='tight')
二、直方图histplot
记录频数还有一个函数是countplot,但它已经与新版numpy不兼容,容易出现图例贴不上的情况,故舍弃
histplot有良好的性能,不算太丑的默认色彩,自动图例,多种堆叠方式
1.离散变量