开源项目推荐:ffq
ffq 是一个开源项目,旨在帮助用户从公共数据库中查找测序数据和元数据。该项目主要使用 Python 编程语言开发。
项目核心功能
ffq 的核心功能是提供了一种便捷的方式来获取存储在多个公共数据库中的测序数据和其相关的元数据。这些数据库包括:
- GEO: Gene Expression Omnibus
- SRA: Sequence Read Archive
- EMBL-EBI: 欧洲生物信息学研究所
- DDBJ: DNA 数据库日本
- NIH Biosample: 生物样本
- ENCODE: DNA 元素百科全书
ffq 通过接收一个访问号(accession),返回该访问号及其后续访问号的元数据。这包括 GEO、SRA、EMBL-EBI、DDBJ 和 Biosample 之间的连接。
项目最近更新的功能
最近,ffq 的更新主要包括以下内容:
- 修复了与 NCBI SRA 文件链接相关的潜在问题。由于 NCBI 正在弃用 SRA 文件链接,这可能会导致使用
--ncbi
参数时返回空列表。项目进行了更新以应对这一变化。 - 优化了项目文档,使文档更加清晰易懂。
- 增加了一些新的使用案例,以展示 ffq 的多种用途。
通过这些更新,ffq 不仅增强了其稳定性和可用性,还扩展了其用户社区的知识库,使其成为一个更加全面的测序数据和元数据检索工具。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考