将musan中的wav文件读出来写入lmdb中;
文章目录
lmdb内部存储结构
- key1 二进制存储: wav1 二进制存储
- key2 二进制存储:wav2 二进制存储
- 。。。
- __keys__ 二进制存储: [key1, key2, …] pickle打包的二进制存储
代码如下
import glob
import wave
import lmdb
import pickle
import argparse
import os
def get_args():
parser = argparse.ArgumentParser(description="load file to lmdb")
parser.add_argument('--indir', required=True, help='root dir of files.')
parser.add_argument('--outdir', required=True, help='lmdb out dir.', default="lmdb")
parser.add_argument('--lmdb_size', default=20, help='lmdb size')
args = parser.parse_args()
return args
def trans_to_lmdb(indir, outdir, lmdb_size_G=20):
i = 0
keys=[]
lmdb_size=lmdb_size_G*1024*1024

该文章介绍了一个Python脚本,用于将Musan目录下的WAV音频文件读取并以二进制形式存储到LMDB数据库中。每个wav文件的key由其路径信息拼接而成,所有keys被pickle序列化后一同保存在数据库中。此外,文章还提供了LMDB的基本操作示例,包括添加、修改和删除数据。
最低0.47元/天 解锁文章
3045





