HDF5与并行文件操作:原理、实践与优化
1. HDF5的自描述特性与优势
传统数据文件格式需要依赖读写代码才能使数据有意义,而Hierarchical Data Format(HDF)的第5个版本,即HDF5,采用了不同的方法。HDF5提供了一种自描述的并行数据格式,之所以称为自描述,是因为数据的名称和特征与数据本身一起存储在文件中。借助文件内包含的数据描述,无需源代码,只需查询文件即可读取数据。
HDF5还拥有丰富的命令行实用工具,如 h5ls 和 h5dump ,可用于查询文件内容。在检查文件是否正确写入时,这些工具非常有用。以二进制格式写入数据可保证速度和精度,但难以检查数据是否正确写入。而这些实用工具提供了一种独立于读取操作来检查写入操作的方法。
2. HDF5基本操作函数
HDF5库分为几个低级别功能组,通过组内所有调用的前缀进行区分。以下是一些重要操作的函数:
- 文件处理操作 :
| 命令 | 描述 |
| ---- | ---- |
| H5Fcreate | 集体打开文件,如果文件不存在则创建 |
| H5Fopen | 集体打开已存在的文件 |
| H5Fclose | 集体关闭文件 |
-
数据空间操作 :
| 命令 | 描述 |
| ---- | ---- |
| H5Screate_simple | 创建多维数组类型 |
| H5Sselect_hypersl
超级会员免费看
订阅专栏 解锁全文
3223

被折叠的 条评论
为什么被折叠?



