CD-HIT 开源项目使用教程
cdhitAutomatically exported from code.google.com/p/cdhit项目地址:https://gitcode.com/gh_mirrors/cd/cdhit
1. 项目的目录结构及介绍
CD-HIT 项目的目录结构如下:
cdhit/
├── doc/
│ ├── cdhit-user-guide.wiki
│ └── ...
├── src/
│ ├── cd-hit.cpp
│ ├── cd-hit-est.cpp
│ └── ...
├── Makefile
├── README.md
└── ...
doc/
目录:包含项目的用户指南和其他文档。src/
目录:包含项目的源代码文件。Makefile
:用于编译项目的 Makefile 文件。README.md
:项目的介绍和使用说明。
2. 项目的启动文件介绍
CD-HIT 项目的主要启动文件位于 src/
目录下,包括:
cd-hit.cpp
:用于蛋白质序列聚类的程序。cd-hit-est.cpp
:用于 DNA/RNA 序列聚类的程序。
这些文件是项目的核心,负责执行序列聚类的功能。
3. 项目的配置文件介绍
CD-HIT 项目没有明确的配置文件,但可以通过命令行参数进行配置。以下是一些常用的命令行参数:
-i
:输入文件路径。-o
:输出文件路径。-c
:相似度阈值。-n
:单词大小。
例如,运行 cd-hit-est
程序的命令如下:
cd-hit-est -i est_human -o est_human95 -c 0.95 -n 8
这个命令将 est_human
文件中的序列进行聚类,并将结果输出到 est_human95
文件中,相似度阈值为 0.95,单词大小为 8。
以上是 CD-HIT 开源项目的基本使用教程,涵盖了项目的目录结构、启动文件和配置方法。希望对您有所帮助。
cdhitAutomatically exported from code.google.com/p/cdhit项目地址:https://gitcode.com/gh_mirrors/cd/cdhit
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考