作图篇:python密度图(Density Plot)

本文探讨了在概率论与统计学习中,如何使用密度图来可视化连续型随机变量的分布。通过一组示例代码,展示了不同缸数车辆的城市里程分布,揭示了X轴与Y轴变量间的关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        在概率论与统计学习方法中,可视化概率密度就变得非常重要了。这种密度图正是可视化连续型随机变量分布的利器,分布曲线上的每一个点都是概率密度,分布曲线下的每一段面积都是特定情况的概率。如下所示,通过将它们按「response」变量分组,我们可以了解 X 轴和 Y 轴之间的关系。

import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
# 密度图

# Import Data
df = pd.read_csv("https://github.com/selva86/datasets/raw/master/mpg_ggplot2.csv")

# Draw Plot
plt.figure(figsize=(16,10), dpi= 80)
sns.kdeplot(df.loc[df['cyl'] == 4, "cty"], shade=True, color="g", label="Cyl=4", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 5, "cty"], shade=True, color="black", label="Cyl=5", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 6, "cty"], shade=True, color="dodgerblue", label="Cyl=6", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 8, "cty"], shade=True, color="orange", label="Cyl=8", alpha=.7)

# Decoration
plt.title('Density Plot of City Mileage by n_Cylinders', fontsize=22)
plt.legend()
plt.show()

 

### 如何使用 Origin 软件绘制 RMSD 的核密度图 #### 工具准备 为了完成此任务,需确保已安装最新版本的 Origin 或兼容版本。Origin 是一款功能强大的数据分析与绘图工具,支持多种复杂图表类型的创建,其中包括核密度图 (Kernel Density Plot)[^1]。 --- #### 数据导入 首先,在 Origin 中准备好数据文件。通常情况下,RMSD 值会存储在一个列向量中。可以通过以下方式加载数据: 1. 打开 Origin 并新建工作簿。 2. 将包含 RMSD 数值的数据粘贴到第一个 Y 列(假设 X 列为空或不适用)。如果存在时间或其他变量作为横坐标,则将其放置于对应的 X 列中[^2]。 --- #### 绘制核密度图的具体操作流程 以下是具体的操作指南: ##### 方法一:通过内置模板快速生成 - **启动绘图命令** 在菜单栏选择 `Plot` -> `Statistics` -> `Probability Density` 来调用概率密度分布选项窗口[^3]。 - **设置参数** - 在弹出对话框中确认输入范围为之前定义好的 RMSD 列; - 对应方法选取 “Gaussian Kernel”,这是最常用的平滑算法之一用于估计连续型随机变量的概率密度函数[^4]。 - **调整属性** 使用右侧边栏中的控件自定义颜色填充样式、边界线粗细以及其他视觉效果以满足个人偏好或者出版物标准需求[^5]。 ##### 方法二:手动编辑实现更精细控制 对于高级用户而言,可能希望进一步定制化图形外观以及计算过程细节。可以按照如下步骤执行: 1. 创建直方图初稿以便后续转换成 KDE 表现形式。 ```python # 示例 Python 代码片段展示如何导出处理后的数据至 CSV 文件供导入 origin 使用 import numpy as np rmsd_values = np.random.normal(loc=0, scale=1, size=(100,)) with open('rmsd_data.csv', 'w') as f: for value in rmsd_values: f.write(f"{value}\n") ``` 2. 导入上述预处理过的 csv 文档进入新项目里并切换视图为二维散点布局模式。 3. 应用插值技术填补空白区域从而形成光滑曲线表示最终成果[^6]。 --- #### 结果优化建议 无论采用哪种途径构建目标图像,都推荐仔细审查以下几个方面来提升整体质量: - 确认带宽(h)的选择合理反映实际特征而不过度拟合噪声成分;过大可能导致重要结构丢失,过小则容易引入虚假峰谷现象[^7]。 - 添加必要的标注说明比如标题文字描述统计指标数值等等辅助理解内容含义的信息元素[^8]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值