TuGraph数据库高可用模式深度解析与实践指南

乌昱有Melanie

于 2025-06-29 09:04:11 发布

阅读量171

点赞数 2

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00057/article/details/148988887

TuGraph数据库高可用模式深度解析与实践指南

tugraph-db TuGraph is a high performance graph database. 项目地址: https://gitcode.com/gh_mirrors/tu/tugraph-db

1. 高可用模式核心原理

TuGraph数据库的高可用(HA)模式基于多机热备份技术实现，通过RAFT一致性协议确保数据安全和服务连续性。在高可用模式下，所有写入操作都会同步到备份组内的多个服务器节点，即使部分节点发生故障，服务依然能够持续可用。

1.1 节点角色与架构

一个完整的高可用集群包含以下角色：

Leader节点：处理所有写入请求，并将操作日志同步到Follower节点
Follower节点：接收并应用Leader同步的操作日志，可处理读请求
Witness节点：特殊类型的节点，仅参与选举不存储实际数据

1.2 数据同步机制

TuGraph采用"多数派确认"机制确保数据安全：

客户端向Leader发起写请求
Leader将操作日志同步到所有Follower节点
当超过半数节点确认接收后，Leader才向客户端返回成功响应
最终所有节点都会应用该操作日志

这种机制保证了即使部分节点故障，系统仍能保留所有已确认的数据。

2. 高可用集群部署方案

2.1 标准部署模式

适用场景：资源充足的生产环境

所有节点均为Replica类型
需要至少3个节点才能容忍1个节点故障
数据安全性最高，但资源消耗较大

2.2 带Witness的简化模式

适用场景：资源受限或特殊网络环境

包含Replica和Witness两种节点类型
Witness节点不存储数据，仅参与选举
可在2台机器上部署：1台运行Replica，另1台运行Replica+Witness
节省资源的同时保证基本的高可用能力

3. 集群部署实践指南

3.1 环境准备

部署高可用集群前需确保：

至少3个TuGraph服务器实例
各节点间网络互通，RPC端口可访问
时钟同步(NTP服务)

3.2 初始集群启动

场景一：全新集群(无数据)

$ ./lgraph_server -c lgraph.json --rpc_port 9090 \
    --enable_ha true \
    --ha_conf 172.22.224.15:9090,172.22.224.16:9090,172.22.224.17:9090

场景二：已有数据节点加入

Leader节点(含数据)：

$ ./lgraph_server -c lgraph.json --rpc_port 9090 \
    --enable_ha true \
    --ha_conf 172.22.224.15:9090,172.22.224.16:9090,172.22.224.17:9090 \
    --ha_bootstrap_role 1

Follower节点(无数据)：

$ ./lgraph_server -c lgraph.json --rpc_port 9090 \
    --enable_ha true \
    --ha_conf 172.22.224.15:9090,172.22.224.16:9090,172.22.224.17:9090 \
    --ha_bootstrap_role 2

3.3 Witness节点配置

基本Witness节点：

$ ./lgraph_server -c lgraph.json --rpc_port 9090 \
    --enable_ha true \
    --ha_conf 172.22.224.15:9090,172.22.224.16:9090,172.22.224.17:9090 \
    --ha_is_witness 1

可升级为Leader的Witness：

$ ./lgraph_server -c lgraph.json --rpc_port 9090 \
    --enable_ha true \
    --ha_conf 172.22.224.15:9090,172.22.224.16:9090,172.22.224.17:9090 \
    --ha_is_witness 1 \
    --ha_enable_witness_to_leader 1

4. 集群运维管理

4.1 节点扩缩容

添加新节点：

$ ./lgraph_server -c lgraph.json --rpc_port 9090 \
    --enable_ha true \
    --ha_conf 172.22.224.15:9090

优雅下线节点：

使用CTRL-C正常停止节点
Leader节点会在下线前完成领导权转移

4.2 集群重启

全集群重启需确保半数以上节点能正常启动：

$ ./lgraph_server -c lgraph.json --rpc_port 9090 \
    --enable_ha true \
    --ha_conf 172.22.224.15:9090,172.22.224.16:9090,172.22.224.17:9090

4.3 状态监控

可视化工具查看：

在DBInfo部分可查看节点列表和角色信息

Cypher查询：

CALL dbms.listServers()

5. Docker环境部署实践

5.1 准备环境

# 拉取镜像
docker pull tugraph/tugraph-runtime-centos7:latest

# 创建容器(host网络模式)
docker run --net=host -itd -v /host/path:/container/path \
    --name tugraph_ha tugraph/tugraph-compile-centos7 /bin/bash

5.2 启动服务

$ lgraph_server -c lgraph.json --host 172.22.224.15 \
    --rpc_port 9090 --enable_ha true \
    --ha_conf 172.22.224.15:9090,172.22.224.16:9090,172.22.224.17:9090