TileDB:通用存储引擎
【免费下载链接】TileDB The Universal Storage Engine 项目地址: https://gitcode.com/gh_mirrors/ti/TileDB
项目基础介绍和主要编程语言
TileDB 是一个强大的通用存储引擎,专门设计用于存储和访问密集和稀疏的多维数组。这些数组可以高效地建模任何复杂数据。TileDB 是一个嵌入式的 C++ 库,支持 Linux、macOS 和 Windows 平台。该项目采用宽松的 MIT 许可证开源,由 TileDB, Inc. 开发和维护。为了与其他 TileDB 产品区分,该项目通常被称为 TileDB Embedded。
项目核心功能
TileDB 提供了丰富的功能,包括:
- 支持密集和稀疏数组:能够处理各种数据类型。
- 数据框和键值存储:通过稀疏数组实现。
- 云存储支持:包括 AWS S3、Google Cloud Storage 和 Azure Blob Storage。
- 分块(分片)数组:优化数据存储和访问。
- 多线程实现:支持并行 IO。
- 数据版本控制:支持快速更新和时间旅行。
- 数组元数据:方便数据管理和查询。
- 多种 API:包括 C、C++、Python、R、Java 和 Go 等。
- 广泛集成:与 Spark、Dask、MariaDB、GDAL 等工具集成。
项目最近更新的功能
TileDB 最近更新的功能包括:
- TileDB-BioImaging:支持生物医学成像,使用 WebP 进行图像优化压缩。
- TileDB Geospatial Tools:包括 GDAL、PDAL 和 Rasterio 等工具。
- TileDB-SOMA:实现 SOMA 规范,用于单细胞基因组数据。
- TileDB-VCF:用于基因组变异数据的库和查询引擎。
- TileDB-Vector-Search:高性能 C++ 编写的向量相似性搜索数据库,具有易于使用的 Python API。
这些更新进一步扩展了 TileDB 的应用场景,特别是在生物医学、地理空间和基因组数据分析领域。
【免费下载链接】TileDB The Universal Storage Engine 项目地址: https://gitcode.com/gh_mirrors/ti/TileDB
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



