clust——共表达聚类

最新推荐文章于 2024-10-11 07:56:51 发布

原创

最新推荐文章于 2024-10-11 07:56:51 发布 · 1.4k 阅读

·

27

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#聚类 #数据挖掘 #机器学习

clust——共表达聚类

文章目录

clust 是一种用于识别在 一个或多个物种的异构数据集中持续共表达（相关性良好）的基因簇（组）的全自动方法。

在这里插入图片描述

（一）对于单个数据集，clust 自动识别共表达基因的 clusters 的数量 k 并完成聚类。

请添加图片描述

（二）对于多个数据集，clust 自动识别在每个输入数据集中共表达（相关性良好）的基因 clusters，此处每个数据集的条件或时间点数量不同。

请添加图片描述

对于 clust，具有如下的特征：

无需对数据进行预处理，clust 能够自动对数据进行归一化处理
无需预设聚类的数量，clust 能够自动识别 cluster 的数目
可以通过参数 -t 控制聚类的紧密度（tightness）
同时也可以适用于如下数据集：
- 由不同技术生成（如 RNA-seq 或微阵列）
- 来自不同物种
- 条件或时间点数量不同
- 同一条件有多个重复
- 需要不同类型的归一化
- 由不同年份和实验室生成
- 存在缺失值
- 并非所有基因都被包含在每个数据集中
输出文件：
- 聚类统计表
- 列出各聚类所含基因的表格
- 预处理（归一化、汇总和过滤）数据集文件
- 聚类基因表达谱图谱（PDF 文件）

官网：https://github.com/BaselAbujamous/clust

网页版：http://clust.baselabujamous.com

安装

方法一：使用 conda（推荐）

conda create -n clust
conda activate clust
conda install -c bioconda clust

方法二：使用 pip

# 以下任选一条命令即可
sudo pip install clust
pip install --user clust

**补充：**更新版本（分别对应如上的安装命令）

conda update -c bioconda clust
sudo pip install clust --upgrade
pip install --user clust --upgrade

使用

1. 基础版

输入数据格式：每个数据集都以单个 TAB 分隔（TSV）文件表示，其中第一列表示基因 ID，第一行表示样本的唯一标签，文件的其

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。