Elasticsearch使用update_by_query

最新推荐文章于 2024-10-03 16:19:15 发布

原创最新推荐文章于 2024-10-03 16:19:15 发布 · 3.1w 阅读

34 ·

CC 4.0 BY-SA版权

文章标签：

#elasticsearch #update_by_query #ElasticsearchClient #UpdateByQueryRequestBuilder #9300

云计算专栏收录该内容

24 篇文章

订阅专栏

elasticsearch中有一个方法是批量修改，就是先查询出需要修改的索引记录，然后批量修改。这个本来没什么，但是使用过的都知道，用java来调用这个方法很别扭。

一般来说，我们使用elasticsearch，都建议使用Java Rest Client，就是RestHighLevelClient这个api。这里得从Java Client和Java Rest Client说起了，低版本的elasticsearch提供了ElasticsearchClient的实现，TransportClient，一个传输客户端。在6.4.x 版本中，需要用TransportClient来构建ElasticsearchClient，并且这个client才是实现本文update_by_query所需的client。

因为我们要使用UpdateByQueryRequestBuilder，所以必须使用ElasticsearchClient，而这个client只能通过TransportClient来构建，在6.4.x版本中，我们还需要引入transport依赖：

<dependency>
  <groupId>org.elasticsearch.client</groupId>
  <artifactId>transport</artifactId>
  <version>6.4.0</version>
</dependency>

因为RestClient无法满足构建条件。transportclient连接elasticsearch，使用的端口是9300，而不是和restclient一样使用的是http连接的9200。

对比一下restclient构建：

elasticsearch开启了两种不同类型的服务端口，transportclient与elasticsearch更加的解耦合。

前面提到了要使用UpdateByQueryRequestBuilder，就必须使用transport依赖。而改依赖里面就是一个简单的实现类PreBuiltTransportClient。

前面废话这么多，无非就是现在elasticsearch版本多，依赖版本也多，而且有的api被丢弃，有的api发生了改变，让我们很难捉摸。

下面我们通过一个简单的示例，了解一下update_by_query，首先通过工具以命令的方式看看执行结果：这里构建一个index=students,type=student的索引，有3条记录，每条记录有一个age字段均为18。

这里通过执行查询然后修改操作，将student的age全部修改为32：

操作执行成功，受影响的记录有3条。再次查看所有的索引记录：

以上这个步骤是通过命令的方式验证了_update_by_query的可行性，我们现在通过java代码的方式来实现这种操作，前面说了，这个操作需要用到ElasticsearchClient，而ElasticsearchClient需要通过TransportClient来构建。这里直接给出源代码，我的pom.xml依赖是这样的：

java代码：

package com.xxx.elasticsearch;
import java.net.InetAddress;
import java.util.HashMap;
import java.util.Map;
import org.apache.logging.log4j.LogManager;
import org.apache.logging.log4j.Logger;
import org.elasticsearch.client.ElasticsearchClient;
import org.elasticsearch.common.settings.Settings;
import org.elasticsearch.common.transport.TransportAddress;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.index.reindex.BulkByScrollResponse;
import org.elasticsearch.index.reindex.UpdateByQueryAction;
import org.elasticsearch.index.reindex.UpdateByQueryRequestBuilder;
import org.elasticsearch.script.Script;
import org.elasticsearch.script.ScriptType;
import org.elasticsearch.transport.client.PreBuiltTransportClient;

@SuppressWarnings("unchecked")
public class UpdateByQueryApp {
	
	private static final Logger log = LogManager.getLogger(UpdateByQueryApp.class);

	private static ElasticsearchClient client = null;
	
	static{
		try {
			client = new PreBuiltTransportClient(Settings.EMPTY)
					.addTransportAddress(
							new TransportAddress(InetAddress.getByName("127.0.0.1"),9300)
					);
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	
	public static void update(){
		UpdateByQueryRequestBuilder updateByQuery = UpdateByQueryAction
				.INSTANCE.newRequestBuilder(client);
		Map<String, Object> params = new HashMap<String, Object>();
		params.put("age", 18);
		ScriptType type = ScriptType.INLINE;
		String lang = "painless";
		String code = "ctx._source.age=params.age";
		Script script = new Script(type, lang, code, params);
		BulkByScrollResponse response = updateByQuery.source("students").script(script)
				.filter(QueryBuilders.termQuery("age", "32"))
				.abortOnVersionConflict(false)
				.get();
		log.info("update : "+response.getUpdated());
	}
	
	public static void main(String[] args) {
		update();
	}

}

前面我们通过命令的方式将所有students索引记录的age修改为了32，这里我们就将所有age=32的记录，全部修改为age=18。运行程序，控制台打印信息如下：

2019-09-04 21:15:02 - org.elasticsearch.plugins.PluginsService.logPluginInfo [main] [INFO ] - no modules loaded
2019-09-04 21:15:02 - org.elasticsearch.plugins.PluginsService.logPluginInfo [main] [INFO ] - loaded plugin [org.elasticsearch.index.reindex.ReindexPlugin]
2019-09-04 21:15:02 - org.elasticsearch.plugins.PluginsService.logPluginInfo [main] [INFO ] - loaded plugin [org.elasticsearch.join.ParentJoinPlugin]
2019-09-04 21:15:02 - org.elasticsearch.plugins.PluginsService.logPluginInfo [main] [INFO ] - loaded plugin [org.elasticsearch.percolator.PercolatorPlugin]
2019-09-04 21:15:02 - org.elasticsearch.plugins.PluginsService.logPluginInfo [main] [INFO ] - loaded plugin [org.elasticsearch.script.mustache.MustachePlugin]
2019-09-04 21:15:02 - org.elasticsearch.plugins.PluginsService.logPluginInfo [main] [INFO ] - loaded plugin [org.elasticsearch.transport.Netty4Plugin]
2019-09-04 21:15:05 - com.xxx.elasticsearch.UpdateByQueryApp.update [main] [INFO ] - update : 3

表明批量修改成功，可以查看记录：

需要注意的是，transportclient和restclient他们构建时所需的端口是不一样的，分别是9300和9200。

10 条评论

fengyeqing5 2020.10.12
如果我想跟新多个值，这里的只是更新一个字段，年龄，我想更新多个字段怎么写script
- SuperAdminzZZ回复TNTZS666 2021.08.19
  在script里拼接就好分号隔开
- TNTZS666回复fengyeqing5 2021.07.29
  大佬能教下怎么更新多个字段吗
- fengyeqing5回复luffy5459 2020.10.19
  嗯，已经弄出来了
- luffy5459回复fengyeqing5 2020.10.13
  没玩过，我猜测可能是分号，然后接着写赋值语句。

like_java_ 2020.07.13
PreBuiltTransportClient 6.4没有这个类呀？

tianzhen620 2020.06.15
博主您好，es7版本更新时可以使用resthighlevelclient吗？或者es7该如何使用updateByQueryRequest更新呢，谢谢
- J-A-M-E回复SuperAdminzZZ 2023.01.12
  感谢!
- SuperAdminzZZ回复MrVan哲学家 2021.08.19
  resthighlevelclient直接用 resthighlevelclient.updateByQuery()就可以了
- MrVan哲学家回复tianzhen620 2020.11.27
  你好，请问解决了吗，resthighlevelclient可以用这个api吗