将pg库单表数据通过dataX同步至es

最新推荐文章于 2025-04-29 18:47:07 发布

Wyx97

最新推荐文章于 2025-04-29 18:47:07 发布

阅读量708

点赞数

文章标签： elasticsearch postgresql devops 运维开发

本文链接：https://blog.youkuaiyun.com/weixin_42574826/article/details/134337475

版权

使用dataX将pg库单表数据同步至es中

背景：
后台系统使用的数据库是pg库，需要上线一个统一查询的功能，考虑使用es中的模糊查询来实现，故需要将pg库中数据表的数据同步至es。

环境

dataX程序包(直接官网下载tar.gz包即可，上传到服务器上解压)
postgresQL(版本12.12)
es(版本7.4.2)

dataX配置文件

xxx.json文件

{
    "job": {
        "setting": {
            "speed": {
 	        "channel": 5
            },
            "errorLimit": {
               "record": 0,
               "percentage": 0.02
            }
        },
        "content": [
            {
               "reader": {
                   "name": "postgresqlreader",
                   "parameter": {
                       "username": "xxx", //这里填写pg库的账号
                       "password": "xxx", //这里填写pg库的密码
                       "connection": [
                           {
                               "querySql":[
                                   "select id,name, data, detail from xxx_table"
                        	   ],
                        	   // pg库的连接地址
                               "jdbcUrl": [
                                    "jdbc:postgresql://x.x.x.x:5432/xxx"
                               ]
                           }
                        ]
                    }
                },
               "writer": {
                   "name": "elasticsearchwriter",
                   "parameter": {
                       // es的目标端地址
                       "endpoint": "http://x.x.x.x:9200",
                       // 创建的索引名称
			           "index": "your_index_name",
			           "type": "default",
			           "cleanup": true,
                       "settings": {"index" :{"number_of_shards": 1, "number_of_replicas": 0}},
                       "discovery": false,
			           "batchSize": 1000,
			           "splitter": ",",
			           // 这边的列要与上面sql里面定义的查询列一一对应，包括数据类型
			           "column": [
			               {"name":"id", "type":"long"},
			               {"name":"name", "type":"text"},
			               {"name":"data", "type":"text"},
			               {"name":"detail", "type":"text"}
			           ]
                   }
               }
            }
        ]
    }
}