Redis批量导入数据

环境:

openstack上的一个8核CPU、16GB内存、110GB磁盘的虚拟机

ubuntu12.04 x64 server系统

安装redis2.6.7

过程:

做实验的时候需要把一个2.1亿条的key-value数据导入redis以提供快速的查询。

安装、配置、启动redis之后,需要把数据导入到redis中。

尝试用jedis写客户端往redis中逐条插入数据的话,速度很慢,一分钟插入几万条就谢天谢地了,2.1亿条得好几天(我猜redis每秒10万条的插入速度是批插的速度,而且是插入的比较短的数据)。

关于redis批插,查了一下,有的用了一个叫redis_import_tools的工具https://github.com/unbracketed/redis-import-tools

使用python写的,看了一下readme感觉有点麻烦,上面说是比redis自带的pipe line功能要快,我还就不信邪了,试试redis自己的pipe line到底能有多慢:

参考http://redis.io/topics/mass-insert

这里写得很清楚了,自己生成一个redis protocol格式的数据文件即可。2.1亿条(9GB,其中纯数据不到4GB)的导入大概用了12分钟的样子,导入后redis-server进程差不多吃掉了90%的内存(总共16GB)。看来:

1、redis自己的pipe还是很强大的;

2、redis十分吃内存,物理内存最好是数据的4倍以上(而且是没有其他进程占用资源的情况下),否则就要设置系统的内存分配方式,使得redis可以使用虚拟内存,但查询速度可能会有所降低。

### 批量导入JSON文件到Redis的方法 批量将JSON数据导入Redis中,可以通过多种方法实现。以下提供几种常见的方式,包括使用Python脚本、Lua脚本以及命令行工具。 #### 方法一:使用Python脚本 通过Python的`redis-py`库可以方便地与Redis交互,并结合`json`模块解析JSON数据。以下是示例代码: ```python import redis import json # 加载JSON文件 def load_json(file_path): with open(file_path, 'r') as f: return json.load(f) # 将JSON数据批量导入Redis def import_to_redis(data, redis_client): for key, value in data.items(): redis_client.execute_command('JSON.SET', key, '.', json.dumps(value)) # 主函数 if __name__ == "__main__": # 连接Redis r = redis.StrictRedis(host='localhost', port=6379, decode_responses=True) # 加载JSON文件 json_data = load_json('data.json') # 导入数据 import_to_redis(json_data, r) ``` 上述代码首先加载JSON文件[^1],然后通过`JSON.SET`命令将每个键值对写入Redis。这种方法适合处理中小规模的JSON文件。 #### 方法二:使用Lua脚本 如果需要更高的性能或更复杂的逻辑,可以编写Lua脚本来完成批量导入。以下是一个简单的Lua脚本示例: ```lua -- 批量导入JSON数据 local function import_json(keys, values) for i, key in ipairs(keys) do local value = values[i] redis.call('JSON.SET', key, '.', value) end end -- 示例调用 local keys = {'key1', 'key2'} local values = {'{"foo":"bar"}', '{"ans":42}'} import_json(keys, values) ``` 此脚本接收两个数组作为参数:一个是键名数组,另一个是对应的JSON字符串数组。通过`JSON.SET`命令将数据写入Redis[^4]。 #### 方法三:命令行工具 如果希望直接通过命令行操作,可以结合`redis-cli`和外部工具(如`jq`)来处理JSON文件。例如: ```bash # 使用 jq 解析 JSON 文件并逐条插入 Redis cat data.json | jq -c '.[]' | while read item; do redis-cli --raw JSON.SET "$(uuidgen)" . "$item" done ``` 上述命令假设`data.json`是一个包含多个JSON对象的数组。通过`jq`将其转换为单行格式,并逐条插入Redis。`uuidgen`用于生成唯一的键名[^3]。 #### 方法四:使用专用工具 一些第三方工具可以帮助简化批量导入过程。例如,`redis-json-importer`等工具提供了友好的界面或命令行选项。具体使用方式请参考工具文档。 --- ### 注意事项 - 确保Redis已启用RedisJSON模块[^1]。 - 对于大规模数据导入,建议分批执行以避免内存占用过高。 - 如果数据结构复杂,可能需要对JSON进行预处理以适配Redis的存储模型。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值