Assembled Genomes Compressor (AGC) 项目推荐
agc Assembled Genomes Compressor 项目地址: https://gitcode.com/gh_mirrors/ag/agc
项目基础介绍和主要编程语言
Assembled Genomes Compressor (AGC) 是一个用于压缩从头组装的基因组集合的工具。该项目主要使用C++编程语言开发,旨在为各种类型的数据集(包括短基因组如病毒和长基因组如人类)提供高效的压缩解决方案。
项目核心功能
AGC 的核心功能包括:
- 高压缩比:特别适用于高质量基因组的压缩,例如人类泛基因组项目中的96个单倍型序列、GRCh 38参考基因组和CHM13 v1.1组装,这些数据集在压缩后可以减少到不到1.5GB。
- 快速访问:压缩后的样本可以快速提取,单个样本或连续片段的提取只需几秒钟。
- 快速压缩:在AMD TR 3990X(使用32个线程)上,压缩人类泛基因组项目的集合大约需要12分钟。
- 灵活的压缩模式:支持多种压缩模式,包括自适应模式(适用于细菌数据)和批量压缩模式。
- 支持多种操作系统:项目支持Windows、Linux和MacOS操作系统,并提供了相应的编译选项。
项目最近更新的功能
AGC 项目最近的更新包括:
-
3.1版本(2024年3月18日):
- 改进了对gzipped输入的压缩速度。
- 增加了对ARM架构CPU的支持(如Mac M1/M2)。
- 增加了对参考样本名称的报告功能。
- 修复了从gzipped输入中截断
.fa
文件的问题。 - 修复了Python库中的
GetCtgSeq()
函数。 - 在解压缩模式中增加了可选的gzipping功能。
- 修复了一些小bug。
-
3.0版本(2022年12月22日):
- 改进了压缩比(略微提高了压缩率)。
- 改进了存档格式,使得包含大量样本的存档查询速度更快。
- 修复了一些bug。
-
2.1版本(2022年5月9日):
- 修复了在append模式下的bug(在2.0版本中,运行append可能会产生不正确的存档)。
-
2.0版本(2022年4月5日):
- 增加了可选的自适应模式(特别适用于细菌数据)。
- 增加了新的模式:解压缩整个集合。
- 改进了存档格式(更紧凑):AGC 1.x工具无法读取AGC 2.x存档,但AGC 2.x工具可以操作AGC 1.x和AGC 2.x存档。
通过这些更新,AGC 项目不断优化其性能和功能,为用户提供更高效、更灵活的基因组压缩解决方案。
agc Assembled Genomes Compressor 项目地址: https://gitcode.com/gh_mirrors/ag/agc
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考