clust——共表达聚类
文章目录
clust 是一种用于识别在 一个或多个物种的异构数据集中持续共表达(相关性良好)的基因簇(组)的全自动方法。

(一)对于单个数据集,clust 自动识别共表达基因的 clusters 的数量 k 并完成聚类。

(二)对于多个数据集,clust 自动识别在每个输入数据集中共表达(相关性良好)的基因 clusters,此处每个数据集的条件或时间点数量不同。

对于 clust,具有如下的特征:
- 无需对数据进行预处理,clust 能够自动对数据进行归一化处理
- 无需预设聚类的数量,clust 能够自动识别 cluster 的数目
- 可以通过参数
-t控制聚类的紧密度(tightness) - 同时也可以适用于如下数据集:
- 由不同技术生成(如 RNA-seq 或微阵列)
- 来自不同物种
- 条件或时间点数量不同
- 同一条件有多个重复
- 需要不同类型的归一化
- 由不同年份和实验室生成
- 存在缺失值
- 并非所有基因都被包含在每个数据集中
- 输出文件:
- 聚类统计表
- 列出各聚类所含基因的表格
- 预处理(归一化、汇总和过滤)数据集文件
- 聚类基因表达谱图谱(PDF 文件)
官网:https://github.com/BaselAbujamous/clust
网页版:http://clust.baselabujamous.com
安装
方法一:使用 conda(推荐)
conda create -n clust
conda activate clust
conda install -c bioconda clust
方法二:使用 pip
# 以下任选一条命令即可
sudo pip install clust
pip install --user clust
**补充:**更新版本(分别对应如上的安装命令)
conda update -c bioconda clust
sudo pip install clust --upgrade
pip install --user clust --upgrade
使用
1. 基础版
输入数据格式:每个数据集都以单个 TAB 分隔(TSV)文件表示,其中第一列表示基因 ID,第一行表示样本的唯一标签,文件的其

最低0.47元/天 解锁文章

70

被折叠的 条评论
为什么被折叠?



