【YashanDB知识库】用yasldr配置Bulkload模式作单线程迁移300G的业务数据到分布式数据库，迁移任务频繁出错

最新推荐文章于 2025-11-29 14:38:57 发布

原创最新推荐文章于 2025-11-29 14:38:57 发布 · 389 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#分布式 #数据库 #YashanDB #崖山数据库

YashanDB知识库专栏收录该内容

268 篇文章

订阅专栏

问题描述

详细版本：YashanDB Server Enterprise Edition Release 23.2.4.100 x86_64 6db1237

影响范围：

离线数据迁移场景，影响业务数据入库。

外场将部分NewCIS的报表业务放到分布式数据库，验证SQL性能水平。

操作系统环境配置：

125G内存

32C CPU

2T的HDD磁盘

问题出现的步骤/操作：

1、部署崖山分布式数据库 1mm 1cn 3dn

单线启动yasldr数据迁移任务，设置32线程的bulk load模式

2、观察yasldr.log 是否出现如下错误

failed to allocate 6812396 bytes memory quota for init bulkload quota

问题分析

BULKLOAD导入过程中所有导入线程的最大可用内存按如下公式配置：

COLUMNAR_MATERIAL_PERCENT * COLUMNAR_VM_BUFFER_SIZE * BULKLOAD_MAX_MEM_PERCENT

相应参数配置：

COLUMNAR_VM_BUFFER_SIZE = 19375M

COLUMNAR_MATERIAL_PERCENT = 80 //没有配置，使用默认配置

BULKLOAD_MAX_MEM_PERCENT = 80 //没有配置，使用默认配置

导入线程的最大可用内存: 80% * 19375M * 80% = 12400M

yasldr进程数（8个）和线程数（32线程），总线程数量： 8 * 32 = 256

平均每个线程的可用内存： 12400M/256 = 48.4375 M

已知配置参数：COLUMNAR_BULK_SIZE = 4096 //指定列存计算每批次记录行数

每行记录如果有20K，就超过平均值，资源变成紧张。

规避方法

1、减小导入线程

2、调大相关内存配置（COLUMNAR_MATERIAL_PERCENT/COLUMNAR_VM_BUFFER_SIZE /BULKLOAD_MAX_MEM_PERCENT）

为保证导入不因内存不足报错，请至少保证每个服务端导入线程内存最小为300M。

可以通过视图dV$bulkloadStat观察bulkload导入的情况

https://doc.yashandb.com/yashandb/23.2/zh/参考手册/配置参数.html

文档中配置参数有详细说明

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。