如何生成可导入数据库的亿级别数据

本文介绍了一种使用Python脚本批量生成大量结构化测试数据的方法,并提供了数据切分技巧。适用于快速搭建测试环境。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 使用python脚本可以轻松生成满足条件的数据,具体如下

#coding: utf-8
import os, sys, time, datetime
from itertools import izip

N = 100000000

def gen_meid():
   return

def gen_seq():
   return

def generate_message(meid,seq):
    ts = time.time();
    time_st = datetime.datetime.fromtimestamp(ts).strftime('%Y-%m-%d %H:%M:%S')
    print '\t'.join(( meid, seq, '\N', '\N', '\N', '\N', '0', '0', '0', '0', time_st, '\N', '\N', '0', '\N', '\N', '\N', '\N', time_st ))

def main(args):
    print '\t'.join(( 'deviceID', 'battery', ... , 'accumulatedTime', 'createDate' ))  // for mongodb, mysql delete
    for meid,seq in izip(gen_meid(),gen_seq()):
        generate_message(meid,seq)
        pass
    return 0

#==============================
if __name__ == "__main__":
 import sys
 main(sys.argv)
 pass
#==============================

$ python a.py > device.tsv

2. 切分数据(可选)

tail -n +1      device.csv | head -n 5000000 > part1.txt

tail -n +100001 device.csv | head -n 100000 > part2.txt

tail -n +200001 device.csv | head -n 100000 > part3.txt

tail -n +300001 device.csv | head -n 100000 > part4.txt


3. 生成txt 文件

python a.py > device.txt



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值