在Java中实现Elasticsearch多索引批量操作：优化单次请求

程序猿 • 2025年11月25日 14:01:47 • java • 阅读 1

本教程旨在指导如何在Java应用程序中通过一次请求，高效地向Elasticsearch的多个不同索引执行批量数据操作。我们将探讨Elasticsearch原生批量API的原理，并详细展示如何使用新的Java API Client和旧的Java Rest High-Level Client来构建包含多索引操作的批量请求，从而优化性能并简化代码。

1. 引言

在处理elasticsearch数据时，我们经常需要对不同类型的数据进行批量索引、更新或删除。一个常见的场景是，我们有多个实体列表，例如 personupdatelist、addressupdatelist 和 positionupdatelist，它们分别对应不同的elasticsearch索引。如果按照传统做法，为每个列表调用一次批量更新操作（例如 this.operations.bulkupdate(list, class)），则会产生多次网络往返，这在数据量大时会显著降低应用程序的性能。

Elasticsearch的批量（Bulk）API设计之初就考虑到了这种需求，它允许在单个请求中对多个索引执行多种操作。本文将深入探讨如何在Java应用程序中，利用Elasticsearch官方客户端实现这一高效的多索引批量操作，从而优化性能并简化代码结构。

2. Elasticsearch批量API基础

Elasticsearch的 _bulk API 允许在一个请求体中包含多个操作（如索引、创建、更新、删除）和文档。其核心优势在于，这些操作可以针对不同的索引和文档类型，而无需为每个操作或每个索引发送单独的HTTP请求。

一个典型的 _bulk 请求体结构如下：

POST _bulk{"index":{"_index":"index_1", "_id":"1"}}{"field1":"value1", "field2":"value2"}{"index":{"_index":"index_2", "_id":"1"}}{"data":"some_data"}{"delete":{"_index":"index_1", "_id":"2"}}

从上述示例可以看出，_bulk 请求体由一系列操作元数据行和可选的文档源数据行组成。每个操作元数据行指定了要执行的操作类型（index、create、update、delete）以及目标索引和文档ID。紧随其后的行（如果操作需要）则是文档的JSON源数据。这种结构使得在一个HTTP请求中处理异构数据成为可能。

立即学习“Java免费学习笔记（深入）”；

3. Java客户端实现：构建多索引批量请求

Elasticsearch提供了多种Java客户端来与集群进行交互。我们将重点介绍两种主要的客户端：新的Java API Client和旧的Java Rest High-Level Client。

3.1 使用Elasticsearch Java API Client (推荐)

Elasticsearch Java API Client 是Elasticsearch官方推荐的、面向未来的Java客户端，它提供了类型安全的API和更好的性能。

要使用此客户端实现多索引批量操作，您需要构建一个 BulkRequest 对象，并向其添加多个操作。每个操作可以指定不同的索引和文档。

import co.elastic.clients.elasticsearch.ElasticsearchClient;import co.elastic.clients.elasticsearch.core.BulkRequest;import co.elastic.clients.elasticsearch.core.BulkResponse;import co.elastic.clients.elasticsearch.core.bulk.BulkResponseItem;import co.elastic.clients.json.JsonData;import java.io.IOException;import java.util.List;import java.util.Map;public class MultiIndexBulkExample {    private final ElasticsearchClient esClient;    public MultiIndexBulkExample(ElasticsearchClient esClient) {        this.esClient = esClient;    }    /**     * 执行多索引批量操作     * @param personDataList 个人数据列表，将索引到 "person_index"     * @param addressDataList 地址数据列表，将索引到 "address_index"     * @param positionDataList 职位数据列表，将索引到 "position_index"     * @throws IOException 如果Elasticsearch操作失败     */    public void bulkSaveMultipleIndices(            List<Map> personDataList,            List<Map> addressDataList,            List<Map> positionDataList) throws IOException {        BulkRequest.Builder br = new BulkRequest.Builder();        // 添加person数据到 "person_index"        for (Map person : personDataList) {            br.operations(op -> op                .index(idx -> idx                    .index("person_index")                    .id(person.get("id").toString()) // 假设每个文档都有一个id字段                    .document(JsonData.of(person))                )            );        }        // 添加address数据到 "address_index"        for (Map address : addressDataList) {            br.operations(op -> op                .index(idx -> idx                    .index("address_index")                    .id(address.get("id").toString())                    .document(JsonData.of(address))                )            );        }        // 添加position数据到 "position_index"        for (Map position : positionDataList) {            br.operations(op -> op                .index(idx -> idx                    .index("position_index")                    .id(position.get("id").toString())                    .document(JsonData.of(position))                )            );        }        // 执行批量请求        BulkResponse result = esClient.bulk(br.build());        // 处理批量操作结果        if (result.errors()) {            System.err.println("Bulk operation had errors:");            for (BulkResponseItem item : result.items()) {                if (item.error() != null) {                    System.err.println("  " + item.error().reason());                }            }        } else {            System.out.println("Bulk operation completed successfully.");        }    }    // 示例用法 (需要初始化ElasticsearchClient)    public static void main(String[] args) throws IOException {        // 实际应用中，esClient应该通过依赖注入或配置来获取        // 例如:        // RestClient restClient = RestClient.builder(new HttpHost("localhost", 9200)).build();        // ElasticsearchTransport transport = new RestClientTransport(restClient, new JacksonJsonpMapper());        // ElasticsearchClient esClient = new ElasticsearchClient(transport);        // 假设我们已经有了esClient实例        ElasticsearchClient esClient = null; // 替换为实际的客户端实例        MultiIndexBulkExample service = new MultiIndexBulkExample(esClient);        // 准备示例数据        List<Map> persons = List.of(            Map.of("id", "p1", "name", "Alice", "age", 30),            Map.of("id", "p2", "name", "Bob", "age", 25)        );        List<Map> addresses = List.of(            Map.of("id", "a1", "street", "Main St", "city", "New York"),            Map.of("id", "a2", "street", "Park Ave", "city", "Los Angeles")        );        List<Map> positions = List.of(            Map.of("id", "pos1", "title", "Engineer", "department", "IT"),            Map.of("id", "pos2", "title", "Manager", "department", "HR")        );        // 调用批量保存方法        // service.bulkSaveMultipleIndices(persons, addresses, positions);        // 注意: 在实际运行前，请确保esClient已正确初始化    }}

代码说明：

BulkRequest.Builder 是构建批量请求的入口。br.operations(op -> op.index(…)) 方法用于向批量请求中添加一个索引操作。在 index 操作中，您需要指定目标索引名称（index(“index_name”)）、文档ID（id(“document_id”)）以及文档内容（document(JsonData.of(yourObject))）。JsonData.of() 可以将您的Java对象转换为Elasticsearch可接受的JSON格式。最后，通过 esClient.bulk(br.build()) 执行请求。

3.2 使用Elasticsearch Java Rest High-Level Client (已弃用，但仍广泛使用)

Elasticsearch Java Rest High-Level Client 是早期广泛使用的客户端，但自Elasticsearch 7.15.0起已被标记为弃用，并将在Elasticsearch 8.0.0中移除。尽管如此，许多现有项目仍在使用它。

使用此客户端，您需要构建一个 BulkRequest 对象，并向其添加多个 IndexRequest、UpdateRequest 或 DeleteRequest。

畅图

AI可视化工具

147 查看详情

import org.elasticsearch.action.bulk.BulkRequest;import org.elasticsearch.action.bulk.BulkResponse;import org.elasticsearch.action.index.IndexRequest;import org.elasticsearch.client.RequestOptions;import org.elasticsearch.client.RestHighLevelClient;import org.elasticsearch.common.xcontent.XContentType;import java.io.IOException;import java.util.List;import java.util.Map;public class MultiIndexBulkHighLevelClientExample {    private final RestHighLevelClient restHighLevelClient;    public MultiIndexBulkHighLevelClientExample(RestHighLevelClient restHighLevelClient) {        this.restHighLevelClient = restHighLevelClient;    }    /**     * 执行多索引批量操作     * @param personDataList 个人数据列表，将索引到 "person_index"     * @param addressDataList 地址数据列表，将索引到 "address_index"     * @param positionDataList 职位数据列表，将索引到 "position_index"     * @throws IOException 如果Elasticsearch操作失败     */    public void bulkSaveMultipleIndices(            List<Map> personDataList,            List<Map> addressDataList,            List<Map> positionDataList) throws IOException {        BulkRequest request = new BulkRequest();        // 添加person数据到 "person_index"        for (Map person : personDataList) {            request.add(new IndexRequest("person_index")                    .id(person.get("id").toString())                    .source(person, XContentType.JSON)); // 将Map转换为JSON        }        // 添加address数据到 "address_index"        for (Map address : addressDataList) {            request.add(new IndexRequest("address_index")                    .id(address.get("id").toString())                    .source(address, XContentType.JSON));        }        // 添加position数据到 "position_index"        for (Map position : positionDataList) {            request.add(new IndexRequest("position_index")                    .id(position.get("id").toString())                    .source(position, XContentType.JSON));        }        // 执行批量请求        BulkResponse bulkResponse = restHighLevelClient.bulk(request, RequestOptions.DEFAULT);        // 处理批量操作结果        if (bulkResponse.hasFailures()) {            System.err.println("Bulk operation had failures:");            // 遍历失败项            bulkResponse.forEach(bulkItemResponse -> {                if (bulkItemResponse.isFailed()) {                    System.err.println("  " + bulkItemResponse.getFailureMessage());                }            });        } else {            System.out.println("Bulk operation completed successfully.");        }    }    // 示例用法 (需要初始化RestHighLevelClient)    public static void main(String[] args) throws IOException {        // 实际应用中，restHighLevelClient应该通过依赖注入或配置来获取        // 例如:        // RestHighLevelClient restHighLevelClient = new RestHighLevelClient(        //     RestClient.builder(new HttpHost("localhost", 9200)));        // 假设我们已经有了restHighLevelClient实例        RestHighLevelClient restHighLevelClient = null; // 替换为实际的客户端实例        MultiIndexBulkHighLevelClientExample service = new MultiIndexBulkHighLevelClientExample(restHighLevelClient);        // 准备示例数据 (同上)        List<Map> persons = List.of(            Map.of("id", "p1", "name", "Alice", "age", 30),            Map.of("id", "p2", "name", "Bob", "age", 25)        );        List<Map> addresses = List.of(            Map.of("id", "a1", "street", "Main St", "city", "New York"),            Map.of("id", "a2", "street", "Park Ave", "city", "Los Angeles")        );        List<Map> positions = List.of(            Map.of("id", "pos1", "title", "Engineer", "department", "IT"),            Map.of("id", "pos2", "title", "Manager", "department", "HR")        );        // 调用批量保存方法        // service.bulkSaveMultipleIndices(persons, addresses, positions);        // 注意: 在实际运行前，请确保restHighLevelClient已正确初始化    }}

代码说明：

BulkRequest 对象用于聚合所有批量操作。request.add(new IndexRequest(“index_name”).id(“document_id”).source(yourObject, XContentType.JSON)) 方法用于添加一个索引操作。source() 方法可以接受各种类型的输入，例如Map、字符串或XContentBuilder。这里我们使用Map并指定 XContentType.JSON。最后，通过 restHighLevelClient.bulk(request, RequestOptions.DEFAULT) 执行请求。

4. 与Spring Data Elasticsearch的集成考量

Spring Data Elasticsearch 提供了一个高级抽象 ElasticsearchOperations，它简化了与Elasticsearch的交互。然而，ElasticsearchOperations 中的 bulkUpdate(List entities, Class entityClass) 等方法通常是针对单一实体类型和单一索引设计的。这意味着它们期望 entities 列表中的所有对象都属于 entityClass 类型，并且会索引到由 entityClass 定义的默认索引中。

当您需要执行真正意义上的“多索引、多类型”批量操作时，即一次性向多个不同索引写入不同类型的数据，ElasticsearchOperations 可能没有直接提供一个一站式的方法。在这种情况下，您需要：

获取底层Elasticsearch客户端： ElasticsearchOperations 通常会封装底层的Elasticsearch客户端（ElasticsearchClient 或 RestHighLevelClient）。您可以通过注入 ElasticsearchClient 或 RestHighLevelClient bean，或者如果 ElasticsearchOperations 提供了访问底层客户端的方法（例如，通过 ElasticsearchRestTemplate 获取），来直接使用它们。

// 假设您已经注入了ElasticsearchClient (对于新客户端)// @Autowired// private ElasticsearchClient esClient;// 或者 RestHighLevelClient (对于旧客户端)// @Autowired// private RestHighLevelClient restHighLevelClient;

手动构建BulkRequest： 按照上述第3节的示例，手动构建 BulkRequest，将不同类型、不同索引的操作添加到同一个请求中。

执行请求： 使用获取到的底层客户端执行构建好的 BulkRequest。

通过这种方式，即使在使用Spring Data Elasticsearch的项目中，您也可以灵活地利用Elasticsearch原生客户端的强大功能，实现复杂的多索引批量操作。

5. 批量操作的注意事项

在执行批量操作时，需要考虑以下几点以确保系统的稳定性、性能和数据完整性：

错误处理： 批量操作并非事务性的。这意味着即使请求中的某些操作失败，其他操作仍然可能成功。因此，在收到 BulkResponse 后，务必检查 result.errors() (新客户端) 或 bulkResponse.hasFailures() (旧客户端)，并遍历 items() 或 forEach() 来识别并处理每个失败的子操作。批量大小： 合理设置批量请求的大小至关重要。过大： 可能导致内存溢出（客户端或Elasticsearch节点）、网络传输延迟增加、请求超时。过小： 导致频繁的网络往返，降低整体吞吐量。建议： 批量大小通常在几百到几千个文档之间，具体取决于文档大小、网络带宽和Elasticsearch集群的资源。最佳实践是通过测试和监控来确定最适合您场景的值。性能优化：异步执行： 对于对响应时间不敏感的场景，可以考虑异步执行批量请求，以避免阻塞主线程。线程池： 如果有大量数据需要批量处理，可以利用线程池并行发送多个批量请求。数据一致性： 批量操作是非事务性的。如果一个批量请求中的部分操作失败，您需要自行处理数据回滚或重试逻辑，以确保应用程序层面的数据一致性。Elasticsearch本身不提供跨文档或跨索引的事务保证。ID管理： 确保为每个文档提供唯一的ID。如果未提供，Elasticsearch会自动生成一个。但在更新或删除操作中，ID是必需的。

6. 总结

通过本教程，我们了解了Elasticsearch批量API的强大功能，它允许在单个请求中对多个不同索引执行数据操作，从而显著提高数据处理效率。我们详细展示了如何使用Elasticsearch Java API Client和Java Rest High-Level Client来构建和执行此类多索引批量请求，并讨论了与Spring Data Elasticsearch集成时的策略。

在实际应用中，通过将多个独立的数据列表聚合到一个 BulkRequest 中，您可以有效地减少网络往返次数，降低服务器负载，并优化应用程序的整体性能。同时，合理处理批量操作的响应和错误，并注意批量大小等性能考量，是构建健壮且高效的Elasticsearch集成方案的关键。

以上就是在Java中实现Elasticsearch多索引批量操作：优化单次请求的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/738628.html

ai app java java api java应用程序 js json red

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Java GUI开发：手写代码还是拖拽构建器？深入解析与选择指南

上一篇 2025年11月25日 14:00:28

解决Java条件判断中“&&”操作符类型不匹配错误的教程

下一篇 2025年11月25日 14:01:58

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8001
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
5000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
2000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
1000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
0000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
1000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
0000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
0000
好文分享

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
0000
好文分享

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
0000
好文分享

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
0000
CSS 帮助

我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

程序猿
2025年12月24日 • 好文分享
2000
好文分享

前端代码辅助工具：如何选择最可靠的AI工具？

前端代码辅助工具：可靠性探讨对于前端工程师来说，在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而，并非所有工具都能提供同等的可靠性。个性化需求关于哪个AI工具最可靠，这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素：立…

程序猿
2025年12月24日
3000
好文分享

如何用 CSS Paint API 实现倾斜的斑马线间隔圆环？

实现斑马线边框样式：探究 css paint api 本文将探究如何使用 css paint api 实现倾斜的斑马线间隔圆环。问题：给定一个有多个圆圈组成的斑马线图案，如何使用 css 实现倾斜的斑马线间隔圆环？答案：立即学习“前端免费学习笔记（深入）”；使用 css paint api…

程序猿
2025年12月24日
0000
好文分享

如何使用CSS Paint API实现倾斜斑马线间隔圆环边框？

css实现斑马线边框样式想定制一个带有倾斜斑马线间隔圆环的边框？现在使用css paint api，定制任何样式都轻而易举。 css paint api 这是一个新的css特性，允许开发人员创建自定义形状和图案，其中包括斑马线样式。立即学习“前端免费学习笔记（深入）”；实现倾斜斑马线间隔圆环 …

程序猿
2025年12月24日
1000