ClickHouse分布式部署搭建单分片二副本集群

搭建单分片二副本集群,使用MergeTree引擎测试数据同步

服务器:

127.0.0.1 clickhouse

127.0.0.2 clickhouse + keeper

结构图

1.修改hosts

vi /etc/hosts

添加需要部署的ip和名字

127.0.0.1 node1
127.0.0.2 node2

2. node1配置文件修改

2.1 修改/etc/clickhouse-server/user.xml
<clickhouse>
    <profiles>
        <!-- Default settings. -->
       <default>
      	<!--默认值为0,表示不启用原子写入;改为与smartbi_replica集群中的副本数相等-->
        	<insert_quorum>2</insert_quorum>
      	<!--默认值为600000毫秒(10分钟);改为30分钟以防止写入和同步副本超时-->
        	<insert_quorum_timeout>1800000</insert_quorum_timeout>
        </default>
        <!-- Profile that allows only read queries. -->
        <readonly>
            <readonly>1</readonly>
        </readonly>
    </profiles>
</clickhouse>
2.2 修改/etc/clickhouse-server/config.d/metrika.xml
<?xml version="1.0"?>
<yandex>
    <clickhouse_remote_servers>
         <smartbi>
			<!-- 数据分片1  -->
            <shard>
              <!-- 可选的。写入分布式表时是否只将数据写入其中一个副本。默认值:false(将数据写入所有副本)。 -->
                <internal_replication>false</internal_replication>
                <replica>
					<!-- host:数据分片节点,可以写机器名,ip地址。-->
					<host>node1</host>
					<!-- port:消息传递TCP端口,默认9000,不要与http端口混淆 -->
                    <port>9000</port>
					<!-- user:用于连接远程服务器的用户名。默认值:default。该用户必须有权限访问该远程服务器。访问权限配置在 users.xml 文件中。 -->
                    <user>default</user>
					<!-- password:用于连接远程服务器的密码。默认为空,users.xml 文件中配置。 -->
                   <password></password>
                </replica>
                <replica>
                    <host>node2</host>
                    <port>9000</port>
                    <user>default</user>
                    <password></password>
               
在 Linux 系统上部署 ClickHouse 分布式集群需要经过多个步骤,包括环境准备、安装 ClickHouse、配置 ZooKeeper、设置集群节点、创建分布式表等。以下是详细的部署过程: ### 安装 ClickHouse 首先,确保所有节点的操作系统环境一致,并安装必要的依赖。以 CentOS 或 Red Hat 系统为例,执行以下命令来安装 ClickHouse: ```bash sudo yum install yum-utils -y sudo rpm --import https://repo.clickhouse.tech/CLICKHOUSE-KEY.GPG sudo yum-config-manager --add-repo https://repo.clickhouse.tech/rpm/stable/x86_64 sudo yum install clickhouse-server clickhouse-client -y sudo /etc/init.d/clickhouse-server start ``` 安装完成后,验证服务是否正常运行: ```bash systemctl status clickhouse-server ``` ### 配置 ZooKeeper ClickHouse 分布式集群依赖于 ZooKeeper 来协调多个节点之间的数据同步和故障转移。需要在所有节点上安装并配置 ZooKeeper。安装完成后,编辑 `zoo.cfg` 文件,设置集群中的各个节点信息,例如: ``` server.1=clickhouse1:2888:3888 server.2=clickhouse2:2888:3888 server.3=clickhouse3:2888:3888 server.4=clickhouse4:2888:3888 ``` 每个节点需要指定唯一的 ID,在 `myid` 文件中设置对应的数字。 ### 配置 ClickHouse 集群 在每台 ClickHouse 节点的配置文件 `config.xml` 或 `metrika.xml` 中添加集群配置信息。例如,配置两个分片,每个分片有两个副本: ```xml <yandex> <remote_servers> <cluster_name> <shard> <replica> <host>clickhouse1</host> <port>9000</port> </replica> <replica> <host>clickhouse2</host> <port>9000</port> </replica> </shard> <shard> <replica> <host>clickhouse3</host> <port>9000</port> </replica> <replica> <host>clickhouse4</host> <port>9000</port> </replica> </shard> </cluster_name> </remote_servers> </yandex> ``` ### 创建分布式表 在所有节点上创建本地表和分布式表。例如,创建一个本地表用于存储数据,再创建一个分布式表用于跨节点查询: ```sql -- 在每个节点上创建本地表 CREATE TABLE local_table ( id UInt64, name String ) ENGINE = MergeTree() ORDER BY id; -- 在任意节点上创建分布式表 CREATE TABLE distributed_table AS local_table ENGINE = Distributed(cluster_name, default, local_table, rand()); ``` ### 验证集群状态 插入数据并查询分布式表,验证数据是否能够在各个节点之间正确分布和查询: ```sql INSERT INTO distributed_table (id, name) VALUES (1, 'Test'); SELECT * FROM distributed_table; ``` ### 监控与维护 定期检查 ClickHouse 和 ZooKeeper 的日志文件,确保集群稳定运行。日志文件通常位于 `/var/log/clickhouse-server/` 目录下。如果遇到问题,可以使用以下命令查看进程状态: ```bash ps aux | grep clickhouse ``` ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雨会停rain

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值