Plotly Python Library的学习记录—— Scatter Plots(散点图)

本文记录了学习Plotly Python库的过程,重点在于Scatter Plots的使用。通过官方学习资源,介绍了如何在数据科学中创建散点图,并分享了在Ubuntu 16.04上安装Plotly的两种方法,包括conda环境和pip安装的注意事项。

目前正在学习plotly,用来在数据科学领域中用来绘制图标的。官方学习地址:https://plot.ly/python/

Basic Charts包括 :

Scatter Plots(散点图),

Line Charts(折线图 ),

Bar Charts(条形图 ),

Pie Charts(饼图),

More Basic Charts(其他基本图表)。

学习案例均来自https://plot.ly/python/中,在此仅对学习的案例进行记录学习。

安装方面:

我在Ubuntu16.04中安装anaconda后,发现pip和pip3都不能正常使用。

解决:一.使用conda新建一个虚拟环境,在里面安装plotly.然后可以使用ipython来学习plotly。

           二.继续采用pip安装。直接pip install plotly会报错,根据报错提示,pip install plotly --user后能正常安装,plotly被安装  在./anaconda3/lib/python3.6/site-packages 下(因为安装完anaconda后pip也被置换为anaconda 中的pip了)。可以采用ipython或者jupyter notebook来学习plotly。

注意:##代表学习中的注释笔记

==================================================================================================

Scatter Plots

例一:
import plotly.plotly as py
import plotly.graph_objs as go

# Create random data with numpy
import numpy 
### 绘制RNAseq数据的散点图并计算相关性 为了完成 RNA-seq 数据的相关性和可视化分析,可以使用 Python 或 R 编程语言中的多种工具库来实现这一目标。以下是两种方法的具体说明。 #### 使用 R 进行 RNA-seq 散点图绘制及相关性计算 R 是一种广泛应用于生物信息学的数据处理和可视化的强大工具。可以通过 `ggplot2` 和其他扩展包(如 ggpubr[^2] 和 shinyCircos[^1])轻松创建高质量的图表。 以下是一个完整的 R 脚本示例: ```r library(ggplot2) library(ggpubr) # 假设我们有两列 RNA-seq 表达数据 data <- data.frame( GeneA = c(1.2, 2.3, 3.5, 4.6, 5.7), GeneB = c(1.1, 2.2, 3.3, 4.4, 5.5) ) # 计算皮尔逊相关系数 correlation <- cor(data$GeneA, data$GeneB, method = "pearson") cat("Pearson Correlation Coefficient:", correlation, "\n") # 创建散点图 scatter_plot <- ggscatter(data, x = "GeneA", y = "GeneB", add = "reg.line", # 添加回归线 conf.int = TRUE, # 显示置信区间 cor.coef = TRUE, # 显示相关系数 cor.method = "pearson") # 方法选择 print(scatter_plot) ``` 上述脚本通过 `ggscatter()` 函数生成了一个带有回归线、置信区间的散点图,并显示了 Pearson 相关系数及其显著性水平。 --- #### 使用 Python 进行 RNA-seq 散点图绘制及相关性计算 Python 中也可以利用 Pandas 和 Matplotlib 库快速完成类似的任务。Seaborn 提供了更高级别的接口用于美观的统计图形展示。 下面是一段基于 Python 的代码实例: ```python import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from scipy.stats import pearsonr # 构造示例数据集 data = { 'GeneA': [1.2, 2.3, 3.5, 4.6, 5.7], 'GeneB': [1.1, 2.2, 3.3, 4.4, 5.5] } df = pd.DataFrame(data) # 计算皮尔逊相关系数 corr_coef, p_value = pearsonr(df['GeneA'], df['GeneB']) print(f"Pearson Correlation Coefficient: {corr_coef}, P-value: {p_value}") # 可视化散点图 sns.set(style="whitegrid") plt.figure(figsize=(8, 6)) scatter_plot = sns.regplot(x='GeneA', y='GeneB', data=df, ci=95) # 自动添加回归线和置信区间 plt.title('Scatter Plot with Regression Line') plt.xlabel('Expression of Gene A') plt.ylabel('Expression of Gene B') # 注释相关系数到图像上 plt.text(1.3, 5.0, f'r={corr_coef:.2f}, p={p_value:.3f}', fontsize=12) plt.show() ``` 此代码片段展示了如何用 Seaborn 自动生成带回归线的散点图以及注释相关性的数值[^3]。 --- #### 总结 无论是采用 R 还是 Python,都可以高效地完成 RNA-seq 数据的相关性分析与可视化工作。两者各有优势:R 更适合于专业的生物学研究者因其丰富的生态支持;而 Python 则因通用性强,在跨领域项目中有更高的灵活性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值