clust——共表达聚类

clust——共表达聚类


clust 是一种用于识别在 一个或多个物种的异构数据集中持续共表达(相关性良好)的基因簇(组)的全自动方法。

在这里插入图片描述

(一)对于单个数据集,clust 自动识别共表达基因的 clusters 的数量 k 并完成聚类。

请添加图片描述

(二)对于多个数据集,clust 自动识别在每个输入数据集中共表达(相关性良好)的基因 clusters,此处每个数据集的条件或时间点数量不同。

请添加图片描述

对于 clust,具有如下的特征:

  • 无需对数据进行预处理,clust 能够自动对数据进行归一化处理
  • 无需预设聚类的数量,clust 能够自动识别 cluster 的数目
  • 可以通过参数 -t 控制聚类的紧密度(tightness)
  • 同时也可以适用于如下数据集:
    • 不同技术生成(如 RNA-seq 或微阵列)
    • 来自不同物种
    • 条件或时间点数量不同
    • 同一条件有多个重复
    • 需要不同类型的归一化
    • 不同年份和实验室生成
    • 存在缺失值
    • 并非所有基因都被包含在每个数据集中
  • 输出文件:
    • 聚类统计表
    • 列出各聚类所含基因的表格
    • 预处理(归一化、汇总和过滤)数据集文件
    • 聚类基因表达谱图谱(PDF 文件)

官网:https://github.com/BaselAbujamous/clust

网页版:http://clust.baselabujamous.com

安装

方法一:使用 conda(推荐)
conda create -n clust
conda activate clust
conda install -c bioconda clust
方法二:使用 pip
# 以下任选一条命令即可
sudo pip install clust
pip install --user clust

**补充:**更新版本(分别对应如上的安装命令)

conda update -c bioconda clust
sudo pip install clust --upgrade
pip install --user clust --upgrade

使用

1. 基础版

输入数据格式:每个数据集都以单个 TAB 分隔(TSV)文件表示,其中第一列表示基因 ID,第一行表示样本的唯一标签,文件的其

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值