clickhouse 集群的搭建见:https://mp.weixin.qq.com/s/JR8wamqNd5Bg6e2CnX6orw 其中配置文件部分需要重点关注,可以看实际文件 config.xml 中的示例做修改
clickhouse 的数据同步见: https://bohutang.me/2020/09/13/clickhouse-and-friends-replicated-merge-tree/
clickhouse 高可用集群的搭建:https://www.modb.pro/db/41061
clickhouse 扩容和缩容的操作见: https://aop.pub/artical/database/clickhouse/cluster-scale/
clickhouse 的备份见:https://aop.pub/artical/database/clickhouse/backup-recovery/
clickhouse 里需要注意的地方:
- clickhouse 在分布式中需要使用到 distributed engine,该 engine 仅支持 insert 和 select 操作,不支持 update 和 delete data 操作,所以在 update 和 delete 操作时,需要注意的是只能在本地表执行
- clickhouse 中的 ReplicatedMergetree 对表的 create delete rename 只能在本地节点操作,无法同步
- clickhouse 的 distributed engine 中 insert 的操作是异步的,可以通过 insert_distributed_sync 将该参数调节为 True 来实现数据的同步插入,数据的同步即指:发出 sql 命令后,sql 命令在每个 shard 节点生效之后才会有返回值,其他相关的参数见:https://stackoverflow.com/questions/63953644/clickhouse-distributed-tables-and-insert-quorum
- clickhouse distribute 引擎下插入数据后删除数据再次插入相同的数据,便会不存在,这个是因为 insert_dumplication 的缘故,https://github.com/ClickHouse/ClickHouse/issues/3526
https://blog.youkuaiyun.com/cwg_1992/article/details/100691109