前言
最近在使用flink消费kafka的数据同步到clickhouse,为了保证高可用,特此查了一下资料,网上大部分都是使用的BalancedClickhouseDataSource,但是这个包虽然可以做到一定程度的负载均衡,但是无法做到故障转移。有兴趣可以去看下BalancedClickhouseDataSource的源码解析:https://blog.youkuaiyun.com/anyitian/article/details/117953600。官方论坛中推荐使用SLB来做负载均衡。下面就来记录一下整个流程。
nginx安装
windows搭建Nginx服务器及常见问题
linux下安装nginx
nginx配置
在nginx的conf目录中找到nginx.conf,打开配置clickhouse的地址和代理。整个配置如下:
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
upstream clickhouse{
server 124.70.101.18:8123;
server 124.70.22.201:8123;
server 124.70.36.237:8123;
server 121.36.18.102:8123;
}
server {
listen 8123;
server_name localhost;
location / {
client_max_body_size 200m;
proxy_pass http://clickhouse;
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
}
使用
clickhouse-jdbc jar包
<dependency>
<groupId>ru.yandex.clickhouse</groupId>
<artifactId>clickhouse-jdbc