自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Python 遍历 Mysql 表中数据

需求 Mysql 表中存在几千万到几亿的数据(不存在自增主键),需要对表中数据进行遍历。 使用的是 pymysql 模块。 方案 1 使用 limit 来分块返回数据。 劣势:使用 limit 每次都需要从头扫描数据表,在数据量超过 1000w 时,性能较低。 LIMIT = 5000 def get_name(sql_client, table_name): i = 0

2018-01-10 19:33:50 11323

原创 Python3 操作 MongoDB 集合分片

因业务需要,使用 Python3 批量生成 MongoDB 集合、并对其做分片操作。 做分片之前需要登陆 Mongo 为要分片的集合所在的库授权。# 在 use 库下对 test 库进行 sharding 授权 use admin sh.enableSharding('test')Python 操作代码 import pymongo import urllib.parse mongo_client

2018-01-03 10:46:04 1825

原创 flume 学习总结

flume 总结flume 总结 下载配置安装 1 下载 2 配置安装 flume 架构 agent 配置 1 source 配置 11 监听网络端口 12 监控文件 2 channel 配置 3 sink 配置 failover 和 load balancing failover load balancing 扇出 二次开发 启动 flume 总结1 下载、配置、安装1.1 下载在官网 http:

2017-04-22 21:45:19 1576

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除