使用`lmplot`函数绘制分组散点图，并使用`map`函数为每个分组添加水平线是一种常见的数据可视化任务。本文将提供详细的代码示例，以帮助你完成这个任务。

最新推荐文章于 2025-02-28 15:53:55 发布

TechPr

最新推荐文章于 2025-02-28 15:53:55 发布

阅读量181

点赞数 1

CC 4.0 BY-SA版权

文章标签：信息可视化 Python

本文链接：https://blog.youkuaiyun.com/TechPr/article/details/132660522

Python 专栏收录该内容

217 篇文章 ¥59.90 ¥99.00

订阅专栏

本文介绍了如何使用Python的Seaborn库中的lmplot函数绘制分组散点图，并通过map函数为每个分组添加水平线。详细展示了数据预处理、lmplot的使用以及添加水平线的步骤，提供了完整的代码示例。

使用lmplot函数绘制分组散点图，并使用map函数为每个分组添加水平线是一种常见的数据可视化任务。本文将提供详细的代码示例，以帮助你完成这个任务。

首先，我们需要导入必要的库，包括seaborn和matplotlib，它们提供了绘图和数据可视化所需的功能。

import seaborn as sns
import matplotlib.pyplot as plt

接下来，我们需要准备数据并组织成适合绘制散点图的形式。假设我们有一个包含两个分组的数据集，每个分组都有两个变量：x和y。我们可以使用Pandas库来处理和组织数据。

import pandas as pd

# 创建示例数据
data

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

TechPr

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

使用Python的lmplot函数绘制分组散点图是很常见的数据可视化操作。在这个过程中，有时候我们需要为这些散点图添加一些水平线，以便更好地展示数据关系。本篇文...

m0_47037246的博客

06-08

441

接下来，我们使用lmplot函数重新绘制分组散点图，并且同时使用map函数为每个类别添加一条水平线。具体实现是，对于每个类别，我们使用plt.axhline函数绘制一条水平线，y参数设置为该类别的平均值，ls参数设置为虚线，color参数设置为灰色。在这个过程中，有时候我们需要为这些散点图添加一些水平线，以便更好地展示数据关系。在上面的代码中，首先使用groupby函数获取了每个类别的平均值，并将结果存储在means变量中。然后，我们可以使用Seaborn的lmplot函数绘制一个分组散点图。

09 - matlab m_map地学绘图工具基础函数 - 绘制区域填充、伪彩色、加载图像和绘制浮雕效果的有关函数

weixin_43339605的博客

07-01

2049

本篇介绍了m_map中区域填充函数（m_hatch）、绘制伪彩色图的函数（m_pcolor）、地图上加载图像函数（m_image）、绘制阴影浮雕效果函数（m_shadedrelief），并提供了绘图示例，对各函数的使用方法和输入参数做了较细的介绍。希望有所助力。

参与评论您还未登录，请先登录后发表或查看评论

python数据分析入门学习笔记

lcc_ccc的博客

04-07

397

python数据分析入门学习笔记目录一、数据分析有关的python库简介 (一)numpy (二)pandas (三)matplotlib (四)scipy (五)statsmodels (六)scikit-learn 二、数据的导入和导出三、数据筛选四、数据描述五、数据处理六、统计分析七、可视化八、其它前言：各种和数据分析相关python库的介绍（前言1~4摘抄自《利用python进行数据分析》） 1.Numpy：　　Numpy是python科学计算的基

seaborn系列 (17) | 回归模型图lmplot()

脑机接口社区

10-02

5546

目录回归模型图函数原型参数解读案例教程案例地址回归模型图回归模型图可以对数据进行回归显示。函数原型 seaborn.lmplot(x, y, data, hue=None, col=None, row=None, palette=None, col_wrap=None, height=5, aspect=1, ...

regplot（）、lmplot（）和 residplot（）之间的区别？

很酷的站长的博客

07-09

1051

一个基于 matplotlib 的 Python 数据可视化包称为 Seaborn。它提供了一个复杂的绘图工具，用于创建引人注目和教育性的统计视觉效果。Seaborn协助解决了Matplotlib的两个主要问题，哪个是？我们现在相信，教学生如何使用ggplot2的方法生成这些表示 - 需要更多的编码，但更先进，适应性强和透明 - 将使学生受益。在这里，由 residPlot（）制作的基本绘图使用 ggplot2 作为资源重建，以帮助用户从 residPlot（）切换到 ggplot2。特征。

图形可视化1：Seaborn之lmplot函数

weixin_44719615的博客

04-03

3784

python使用Seaborn可视化库代码如下 import pandas as pd import seaborn as sns import numpy as np a = pd.read_excel(‘fuji.xlsx’) rows = a[0:11] print(rows) x = np.array(rows[‘c’]).reshape(1, -1) y = np.array(rows...

数据可视化-Pyecharts绘制散点图

m0_74394367的博客

04-22

2040

本实验通过绘制pyecharts库的散点图，讲解使用pandas读取文件、绘制散点图及使用pyecharts的set_global_opts和set_series_opts方法设置优化图表，改善图表的美观度，使其更加美观和易于理解。

Python数据分析绘制折线图（relplot()函数）及可视化

qq_38436467的博客

12-06

1597

读取数据# 数据清洗data.dropna(inplace=True) # 删除缺失值data.drop_duplicates(inplace=True) # 删除重复值# 数据转换data["date"] = pd.to_datetime(data["date"]) # 将日期列转换为datetime类型data["year"] = data["date"].dt.year # 提取年份data["month"] = data["date"].dt.month # 提取月份。

【Seaborn】sns.lmplot() 函数：多类别回归拟合散点图

彬彬侠的博客

02-28

717

seaborn.lmplot()是回归分析的可视化工具，它与sns.regplot()类似，但支持按类别(hue)区分数据，适用于分组回归分析，称为多类别回归拟合散点图（Linear Model Plot）。-sns.lmplot()适用于多个类别的回归分析。-常见参数hue按类别分色，col/row生成多个子图。order=2多项式回归，scatter=False仅显示回归线。

使用Seaborn的lmplot函数可视化散点图并添加回归曲线以及回归线对应的置信区间

BitLordX的博客

09-05

409

在Python中，Seaborn是一个功能强大的数据可视化库，它建立在Matplotlib之上，提供了一些方便的函数和方法来创建各种统计图形。其中的lmplot函数可以用于绘制散点图，并添加回归曲线以及回归线对应的置信区间。其中，x和y是数据变量的名称，data是一个可选参数，用于指定数据的DataFrame。综上所述，使用Seaborn的lmplot函数可以方便地创建散点图并添加回归曲线以及回归线对应的置信区间。这种可视化方法可以帮助我们更好地理解数据之间的关系，并对回归模型的准确性有一个直观的认识。

Seaborn 回归(Regression)及矩阵(Matrix)绘图

专注基础架构领域

11-17

1390

logistic：logistic=True时，假设y取值只有2个比如True和False，并用statsmodels中的逻辑回归模型回归。lmplot（回归统计绘图）：figure级regplot函数，绘图同regplot完全相同。对每个x值的所有y值用函数计算，绘制得到的点，并绘制误差线。x_jitter会随机改变图中散点的x坐标，y_jitter会随机改变图中散点的y坐标。聚合热度图，绘制一个分层聚合的热度图。robust参数为True时，会降低异常值的权重，在需要剔除异常值时，非常有用。

sns.lmplot函数介绍

weixin_43597208的博客

02-06

473

sns.lmplot 是 Seaborn 库中的一个函数，用于绘制线性回归模型图。它主要用于可视化两个变量之间的关系，并拟合一条回归线来展示它们的线性趋势。lmplot 支持多种回归模型，并允许通过分组变量进行分组绘图。x=None,y=None,data=None,hue=None,col=None,row=None,height=5,aspect=1,x_ci='ci',ci=95,order=1,size=None主要参数说明。

Tableau数据分析-Chapter06填充地图、多维地图、混合地图

北山啦的博客

01-19

5198

Tableau-Chapter06填充地图、多维地图、混合地本专栏将使用tableau来进行数据分析，Tableau数据分析-Chapter06填充地图、多维地图、混合地图，记录所得所学，作者：北山啦文章目录Tableau-Chapter06填充地图、多维地图、混合地本专栏将使用tableau来进行数据分析，Tableau数据分析-Chapter06填充地图、多维地图、混合地图，记录所得所学，作者：北山啦原文链接： ...

python统计分析——用seaborn绘制回归直线（sns.lmplot）

maizeman126的博客

02-23

1829

（11）hue_order=None, col_order=None, row_order=None，用于设置显示顺序。（13）x_estimator=None，x_bins=None, x_ci='ci'，当x轴数据为离散型数据时使用。（12）legend=True，当设置hue参数后，用于设置是否显示图例。（4）col=None，row=None，两个参数类似，col表示分列显示，row表示分行显示。（6）col_wrap=None，当设置了col参数后，用于设置显示的列数，与row参数不兼容。

2020-11-21

RayQAQ1314的博客

11-22

254

第十一周周报正则表达式字元符字符含义模式字符串匹配字符串普通字符串匹配自身 adc adc .匹配任意除换行符外的字符 a.c abc \转义字符，使后一个字符改变原来的意思 a\c;a\c a.c;a\c 匹配前一个字符0次或者无限次 abc* ;adccc +匹配前一个字符1

Python高级可视化库seaborn回归分析(基础整理)

公众号：瑞行AI

11-02

1万+

探索变量间的关系两个变量：lmplot，绘制回归模型（1.1）两个维度数据都是连续的：散点图 + 线性回归 + 95%置信区间（1.2）一个维度数据是连续的，一个维度数据是离散的，连续轴抖动x_jitter参数（1.3）x_estimator参数将“离散取值维度”用均值和置信区间代替散点拟合不同模型（1.1）lmplot默认参数线性拟合（1.2）lmplot的order参数，设置高阶拟合

Seaborn使用lmplot函数可视化散点图并添加回归曲线以及回归线对应的置信区间（Scatter plot with regression line）

data+scenario+science+insight

12-24

1183

Seaborn使用lmplot函数可视化散点图并添加回归曲线以及回归线对应的置信区间（Scatter plot with regression line）

Seaborn使用lmplot函数可视化散点图并添加回归曲线、移除默认的回归曲线置信区间（Scatter plot with regression line、Remove CI band）

data+scenario+science+insight

02-19

1594

Seaborn使用lmplot函数可视化散点图并添加回归曲线、移除默认的回归曲线置信区间（Scatter plot with regression line、Remove CI band）

Python可视化 | Seaborn5分钟入门(五)——lmplot

最新发布

07-02

<think>我们有一个需求：在同一画板上为多个变量的两个分组数据绘制小提琴图。这意味着我们有多个变量（例如，多个测量指标），每个变量都有两个分组（例如，对照组和实验组），我们希望在一个图中展示所有这些变量的小提琴图，以便比较。根据引用[4]，Seaborn有图形级函数和坐标轴级函数。对于多变量的小提琴图，我们可以考虑使用坐标轴级函数（如`violinplot`）结合子图，或者使用图形级函数（如`catplot`）来分面绘制。但是，用户要求在同一画板上绘制，即所有小提琴图都在同一个坐标轴（或并列排列）中。这里有两种常见情况：1.将多个变量并排放置在同一画板上，每个变量的小提琴图并排显示两个分组（即每个变量占一组位置，该组位置内有两个小提琴代表两个分组）。2.将多个变量作为不同的子图（分面）绘制在同一画板上。用户没有明确说明是希望并排放置还是分面，但根据问题描述“在同一画板上”，我们可以提供两种方案，并重点讲解第一种（并排放置）因为更紧凑。方案一：并排放置（多个变量并排，每个变量内有两个分组）数据结构要求：长格式数据（long-form），即一列表示变量名，一列表示分组，一列表示数值。示例数据结构：VariableGroupValueVar1A5.1Var1B6.2Var2A3.5Var2B4.2.........然后使用`x='Variable',y='Value',hue='Group'`来绘制。方案二：分面绘制（每个变量一个子图）使用`seaborn.FacetGrid`或图形级函数`catplot`（kind='violin'）来实现。由于用户要求“多个变量的两个分组”，并且在同一画板上，我们重点讲解方案一，因为方案二的分面也是在同一画板（figure）上。下面我们给出方案一的代码示例：步骤：1.准备数据：将多个变量的数据转换为长格式（可以使用pandas的melt方法）。2.使用seaborn的`violinplot`函数，设置x为变量名，y为数值，hue为分组（两个分组）。3.调整图形样式。注意：如果变量很多，并排放置可能会导致拥挤，可以调整图形大小或使用水平方向。示例代码： ```pythonimport seaborn assnsimportmatplotlib.pyplotas pltimportpandas aspd#假设我们有一个宽格式数据框，每一列是一个变量，另外有一列是分组（两个分组）#例如：#GroupVar1Var2Var3#A5.13.510.2#A5.84.19.5#B6.24.211.3#B7.35.012.1#转换为长格式#假设原始数据框为df，包含'Group'列和多个变量列#使用meltdf_long =pd.melt(df, id_vars=['Group'], value_vars=['Var1','Var2','Var3'],var_name='Variable', value_name='Value')#绘制小提琴图plt.figure(figsize=(12,6))#调整画布大小ax= sns.violinplot(x='Variable', y='Value', hue='Group', data=df_long,split=True, palette='Set2')#设置标题和标签ax.set_title('MultipleVariables Violin Plotby Group') ax.set_xlabel('Variables')ax.set_ylabel('Measurement')#显示图例plt.legend(title='Group', loc='upperright')plt.show() ```说明： -`split=True`：这个参数使得两个分组的小提琴图背靠背绘制（在同一位置左右分开），这样更节省空间且便于比较。但是注意，split=True要求每个变量在每个分组中都有数据，且通常用于两个分组的情况。-如果不使用split，则两个分组的小提琴图会并排放置（每个变量位置会有两个独立的小提琴图，稍微分开）。此时可以使用`dodge=True`（默认）来控制是否分开。如果不想背靠背，而是并排（每个变量位置有两个独立的小提琴），则去掉split参数，或者设置split=False，并确保dodge=True（默认就是True）：```pythonax =sns.violinplot(x='Variable',y='Value',hue='Group',data=df_long, dodge=True, palette='Set2')```另外，如果变量名很长，我们可以考虑将x轴和y轴互换，变成水平小提琴图：```pythonax= sns.violinplot(y='Variable', x='Value', hue='Group', data=df_long,split=True, palette='Set2')```方案二：分面绘制（使用FacetGrid）如果希望每个变量单独一个子图（并排排列），可以使用： ```pythong =sns.FacetGrid(df_long,col='Variable',col_wrap=3,sharey=False)g =g.map(sns.violinplot, 'Group','Value', palette='Set2')```或者使用`catplot`（图形级函数）： ```pythonsns.catplot(x='Group', y='Value', col='Variable', data=df_long,kind='violin', palette='Set2',height=4, aspect=0.7, sharey=False) ```注意：分面绘制时，每个子图只显示一个变量，但会显示该变量的两个分组。根据用户需求，我们重点展示了第一种方法（并排放置在同一坐标轴中）。用户可以根据数据的特点和展示需求选择合适的方式。引用说明：我们在绘制小提琴图时参考了引用[1]和[2]中提到的小提琴图绘制方法，特别是split参数的使用[^1][^2]。</think>### 在同一画板上为多个变量的两分组数据绘制小提琴图要同时可视化多个变量的两个分组数据，关键在于数据预处理和Seaborn的`hue`参数应用。以下是完整解决方案： #### 数据准备（长格式转换） ```python import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 原始数据示例（宽格式） data_wide = pd.DataFrame({ 'Group': ['Control', 'Treatment'] * 50, 'Variable1': np.concatenate([np.random.normal(0, 1, 50), np.random.normal(1, 1.2, 50)]), 'Variable2': np.concatenate([np.random.normal(5, 1, 50), np.random.normal(7, 0.8, 50)]), 'Variable3': np.concatenate([np.random.gamma(2, 2, 50), np.random.gamma(3, 1.5, 50)]) }) # 转换为长格式（关键步骤） data_long = pd.melt( data_wide, id_vars=['Group'], value_vars=['Variable1', 'Variable2', 'Variable3'], var_name='Metric', value_name='Value' ) ``` #### 基础绘图实现 ```python plt.figure(figsize=(12, 8)) ax = sns.violinplot( x='Metric', # X轴：变量名称 y='Value', # Y轴：数值 hue='Group', # 分组：控制组/实验组 data=data_long, # 长格式数据 split=True, # 背靠背显示分组[^1] palette='coolwarm', inner='quartile', # 显示四分位数 bw_adjust=0.6 # 密度曲线平滑度 ) # 美化图形 plt.title('多变量分组分布比较', fontsize=14) plt.xlabel('测量指标', fontsize=12) plt.ylabel('数值分布', fontsize=12) plt.xticks(rotation=15) plt.legend(title='实验分组', loc='upper right') plt.tight_layout() plt.show() ``` #### 高级定制技巧 1. **添加统计显著性标注**： ```python from statannotations.Annotator import Annotator # 定义比较组合 pairs = [ (("Variable1", "Control"), ("Variable1", "Treatment")), (("Variable2", "Control"), ("Variable2", "Treatment")), (("Variable3", "Control"), ("Variable3", "Treatment")) ] # 添加统计标注 annotator = Annotator(ax, pairs, data=data_long, x='Metric', y='Value', hue='Group') annotator.configure(test='Mann-Whitney', text_format='star') annotator.apply_and_annotate() ``` 2. **组合散点图增强可视化**： ```python sns.stripplot( x='Metric', y='Value', hue='Group', data=data_long, dodge=True, # 避免点重叠 alpha=0.3, size=4, palette='dark:black', ax=ax ) ``` 3. **调整布局避免重叠**： ```python plt.figure(figsize=(15, 6)) sns.violinplot(..., dodge=True, width=0.8) # 增加间距 plt.subplots_adjust(bottom=0.15) # 底部留空间 ``` #### 专业建议 1. **颜色选择原则**： - 使用互补色区分分组（如蓝/橙） - 超过5个变量时使用`hls`色系：`palette=sns.color_palette("hls", 8)` 2. **分布解读指南**： - **宽度变化** → 数据密度分布[^1] - **峰度差异** → 组间集中程度对比 - **偏斜方向** → 数据偏移趋势 - **多峰结构** → 潜在子群体存在 3. **适用场景**： - 同时比较≥3个指标的组间分布 - 分析治疗前后的多指标变化 - 产品质量的多维度控制组分析 > 当变量超过6个时，建议使用`plt.figure(figsize=(18, 6))`加宽画布或考虑分面绘图(`sns.FacetGrid`)[^4]。对于高度偏斜数据，可添加`scale='count'`参数按样本量调整宽度。