StarRocks 如何在本地搭建存算分离集群

之前写过一篇 StarRocks 开发环境搭建踩坑指北之存算分离篇讲解如何在本地搭建一个可以 debug 的存算分离版本。

但最近在本地调试一个场景,需要 CN 节点是以集群的方式启动,我还是按照老方法通过 docker 启动 CN,然后 export 端口的方式让 FE 进行绑定。

比如用以下两个命令可以启动两个 CN 节点。

/* by 01130.hk - online tools website : 01130.hk/zh/createmeta.html */
docker run -p 9060:9060 -p 8040:8040 -p 9050:9050 -p 8060:8060 -p 9070:9070 -itd --rm --name cn -e "TZ=Asia/Shanghai" starrocks/cn-ubuntu:3.5.2
/* by 01130.hk - online tools website : 01130.hk/zh/createmeta.html */
docker run -p 9061:9060 -p 8041:8040 -p 9051:9050 -p 8061:8060 -p 9071:9070 -itd --rm --name cn2 -e "TZ=Asia/Shanghai" starrocks/cn-ubuntu:3.5.2

然后按照之前的方式在 FE 中手动绑定这两个节点:

ALTER SYSTEM ADD COMPUTE NODE "127.0.0.1:9050";  
ALTER SYSTEM ADD COMPUTE NODE "127.0.0.1:9051";  
show compute nodes;

此时会出现新增的第二个节点的状态有问题,比如 metrics 取不到,workerId 是-1(-1 代表节点创建失败了,默认值是 -1)



经过 debug 发现是在添加节点的时候,由于生成的 workerIpPort 与上一个节点相同(127.0.0.1:9060) 从而导致这个节点被跳过了。

也就是说我这两个 CN 节点不能是相同的 IP(用不同的端口来区分)。

解决这个问题有以下几个办法:

  • 再找一个台机器来跑 CN2 节点
  • 启动一个虚拟机来跑 CN2 节点
  • 使用 docker compose 来启动 CN 集群,会在集群内自动分配不同的 IP
  • 利用 Docker Bridge 创建一个虚拟网络,由他来分配 IP

第一种方案直接 Pass 了,我手上没有多余的设备。

第二种方案倒是可以直接用 OrbStack 启动一个 VM,但是还不如后面的 docker 来的轻量,此外还需要我安装运行环境,也 pass 了。

第三种方案看似可行,但也比较繁琐,由于 CN 给 docker compose 管理了,FE 要和 CN 网络打通也得在 docker compose 里运行,这样我 Debug 就不方便了,更别提如果需要频繁修改源码的情况。

甚至每次修改代码后都得重新打包上传镜像,以及开启 remote debug,非常麻烦。

这么看来就第四种方案最为合适了。

使用 Docker Bridge 网络

我们可以使用 Docker Bridge 创建一个虚拟网络,使用这个虚拟网络启动的镜像会自动分配自定义范围的 IP;同时本地启动的 FE 也能直接访问。

docker network create --subnet=172.18.0.0/16 --gateway=172.18.0.1 my_custom_net

首先用 docker 创建一个 network。

  • --subnet=172.18.0.0/16: 定义网络的 IP 地址范围。这里我们使用了 172.18.x.x 这个私有网段。
  • --gateway=172.18.0.1: 指定这个网络的网关地址。

之后我们就可以使用这个虚拟网络来启动容器了。

docker run --ip 172.18.0.20 --net my_custom_net -p 9060:9060 -p 8040:8040 -p 9050:9050 -p 8060:8060 -p 9070:9070 -itd --rm --name cn -e "TZ=Asia/Shanghai" starrocks/cn-ubuntu:3.5.2

docker run --ip 172.18.0.30 --net my_custom_net -p 9061:9060 -p 8041:8040 -p 9051:9050 -p 8061:8060 -p 9071:9070 -itd --rm --name cn2 -e "TZ=Asia/Shanghai" starrocks/cn-ubuntu:3.5.2

这样这两个容器就会被分配不同的 IP,并且网络和宿主机也是互通的。

需要注意的是这里的子网尽量选择 172.16.0.0 到 172.31.255.255 这个 IP 段,192.168.0.0 到 192.168.255.255 这个范围段很有可能家里或公司的路由器占用了。

而这里的网关 --gateway=172.18.0.1地址也需要在我们自定义的 IP 范围里。

同时我们也不需要在这两个容器内为 CN 指定 priority_networks 参数了。

同理 minio 也得使用这个虚拟网络启动:

docker run -d --rm --name minio \
  --ip 172.18.0.10 \
  --net my_custom_net \
  -e MINIO_ROOT_USER=miniouser \
  -e MINIO_ROOT_PASSWORD=miniopassword \
  -p 9001:9001 \
  -p 9000:9000 \
  --entrypoint sh \
  minio/minio:latest \
  -c 'mkdir -p /minio_data/starrocks && minio server /minio_data --console-address ":9001"'

设置 token 的时候也要指定对应的 IP:

mc alias set myminio http://172.18.0.10:9000 miniouser miniopassword; mc admin user svcacct add --access-key AAAAAAAAAAAAAAAAAAAA --secret-key BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB myminio miniouser

当 CN 和 minio 都启动之后,我们在 FE 里手动绑定这两个 CN 节点:

ALTER SYSTEM ADD COMPUTE NODE "172.18.0.20:9050";
ALTER SYSTEM ADD COMPUTE NODE "172.18.0.30:9050"

这样这两个节点就可以绑定成功了。

Blog

作者: crossoverJie

出处: https://crossoverjie.top

欢迎关注博主公众号与我交流。

本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出, 如有问题, 可邮件(crossoverJie#gmail.com)咨询。

【电动汽车充电站有序充电调度的分散式优化】基于蒙特卡诺和拉格朗日的电动汽车优化调度(分时电价调度)(Matlab代码实现)内容概要:本文介绍了基于蒙特卡洛和拉格朗日方法的电动汽车充电站有序充电调度优化方案,重点在于采用分散式优化策略应对分时电价机制下的充电需求管理。通过构建数学模型,结合不确定性因素如用户充电行为和电网负荷波动,利用蒙特卡洛模拟生成大量场景,并运用拉格朗日松弛法对复杂问题进行分解求解,从而实现全局最优或近似最优的充电调度计划。该方法有效降低了电网峰值负荷压力,提升了充电站运营效率与经济效益,同时兼顾用户充电便利性。 适合人群:具备一定电力系统、优化算法和Matlab编程基础的高校研究生、科研人员及从事智能电网、电动汽车相关领域的工程技术人员。 使用场景及目标:①应用于电动汽车充电站的日常运营管理,优化充电负荷分布;②服务于城市智能交通系统规划,提升电网与交通系统的协同水平;③作为学术研究案例,用于验证分散式优化算法在复杂能源系统中的有效性。 阅读建议:建议读者结合Matlab代码实现部分,深入理解蒙特卡洛模拟与拉格朗日松弛法的具体实施步骤,重点关注场景生成、约束处理与迭代收敛过程,以便在实际项目中灵活应用与改进。
### StarRocks 存算一体与存算分离架构对比 #### 1. **存算一体架构** ##### 特点 - 数据存储和计算资源紧密耦合在一起,通常部署在同一节点上。 - 资源分配固定,适合处理固定的负载模式。 ##### 优点 - 更低的延迟:由于数据和计算位于同一物理位置,减少了网络传输带来的额外开销[^1]。 - 高效的数据访问:本地化的数据读取可以显著提高查询效率,尤其是在高并发场景下表现优异。 ##### 缺点 - 扩展性有限:当需要增加计算或存储容量时,必须整体扩容整个集群,可能导致资源浪费。 - 成本较高:对于大规模数据分析需求,硬件成本可能迅速上升。 ##### 适用场景 - 实时分析:适用于对实时性和响应速度有极高要求的应用场景,如在线广告投放、金融风控等。 - 小规模集群:在小型项目或者初期阶段,存算一体化结构简单易维护,能快速满足业务需求。 #### 2. **存算分离架构** ##### 特点 - 计算层和存储层完全解耦,各自独立扩展。 - 支持按需动态调整计算和存储资源的比例。 ##### 优点 - 弹性伸缩:可以根据实际需求灵活调整计算和存储资源,优化资源配置并降低成本[^2]。 - 可靠性强:即使部分计算节点发生故障,也不会影响到其他组件的工作状态;同时支持多副本机制保障数据安全可靠。 ##### 缺点 - 较高的复杂度:相比起简单的单机版产品来说实现起来更加困难一些,并且运维难度也会相应增大。 - 性能波动:跨节点间通信可能会引入一定的延时,在某些极端条件下会影响最终用户体验效果。 ##### 适用场景 - 大型分布式系统:特别是那些涉及海量非结构化文件处理的任务非常适合采用这种方式来进行操作实施比如日志收集平台建设过程中就需要考虑到这一点因素的影响程度如何合理规划好相应的技术路线图才能更好地服务于后续具体实践环节当中去达成既定目标值水平之上再寻求突破创新之路途之中不断探索前行方向直至成功抵达彼岸为止才行哦!另外还有像视频监控领域内的图像识别算法训练过程也需要依赖于这样的基础环境支撑才能够顺利完成各项预定计划安排事项清单列表里面所列出来的全部内容无误之后才可以正式对外发布上线运行版本号信息公告通知相关人员前来下载安装试用体验一番看看感觉怎么样吧😊! ```python # 示例代码展示如何配置StarRocks以适应不同的架构模式 def configure_starrocks(architecture_type): if architecture_type == 'integrated': # 设置存算一体参数 config = { "storage_and_compute": True, "auto_scaling": False } elif architecture_type == 'separated': # 设置存算分离参数 config = { "storage_and_compute": False, "auto_scaling": True } return config ``` ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值