在Java中实现Elasticsearch多索引批量操作:优化单次请求

在Java中实现Elasticsearch多索引批量操作:优化单次请求

本教程旨在指导如何在Java应用程序中通过一次请求,高效地向Elasticsearch的多个不同索引执行批量数据操作。我们将探讨Elasticsearch原生批量API的原理,并详细展示如何使用新的Java API Client和旧的Java Rest High-Level Client来构建包含多索引操作的批量请求,从而优化性能并简化代码。

1. 引言

在处理elasticsearch数据时,我们经常需要对不同类型的数据进行批量索引、更新或删除。一个常见的场景是,我们有多个实体列表,例如 personupdatelist、addressupdatelist 和 positionupdatelist,它们分别对应不同的elasticsearch索引。如果按照传统做法,为每个列表调用一次批量更新操作(例如 this.operations.bulkupdate(list, class)),则会产生多次网络往返,这在数据量大时会显著降低应用程序的性能。

Elasticsearch的批量(Bulk)API设计之初就考虑到了这种需求,它允许在单个请求中对多个索引执行多种操作。本文将深入探讨如何在Java应用程序中,利用Elasticsearch官方客户端实现这一高效的多索引批量操作,从而优化性能并简化代码结构。

2. Elasticsearch批量API基础

Elasticsearch的 _bulk API 允许在一个请求体中包含多个操作(如索引、创建、更新、删除)和文档。其核心优势在于,这些操作可以针对不同的索引和文档类型,而无需为每个操作或每个索引发送单独的HTTP请求。

一个典型的 _bulk 请求体结构如下:

POST _bulk{"index":{"_index":"index_1", "_id":"1"}}{"field1":"value1", "field2":"value2"}{"index":{"_index":"index_2", "_id":"1"}}{"data":"some_data"}{"delete":{"_index":"index_1", "_id":"2"}}

从上述示例可以看出,_bulk 请求体由一系列操作元数据行和可选的文档源数据行组成。每个操作元数据行指定了要执行的操作类型(index、create、update、delete)以及目标索引和文档ID。紧随其后的行(如果操作需要)则是文档的JSON源数据。这种结构使得在一个HTTP请求中处理异构数据成为可能。

立即学习“Java免费学习笔记(深入)”;

3. Java客户端实现:构建多索引批量请求

Elasticsearch提供了多种Java客户端来与集群进行交互。我们将重点介绍两种主要的客户端:新的Java API Client和旧的Java Rest High-Level Client。

3.1 使用Elasticsearch Java API Client (推荐)

Elasticsearch Java API Client 是Elasticsearch官方推荐的、面向未来的Java客户端,它提供了类型安全的API和更好的性能。

要使用此客户端实现多索引批量操作,您需要构建一个 BulkRequest 对象,并向其添加多个操作。每个操作可以指定不同的索引和文档。

import co.elastic.clients.elasticsearch.ElasticsearchClient;import co.elastic.clients.elasticsearch.core.BulkRequest;import co.elastic.clients.elasticsearch.core.BulkResponse;import co.elastic.clients.elasticsearch.core.bulk.BulkResponseItem;import co.elastic.clients.json.JsonData;import java.io.IOException;import java.util.List;import java.util.Map;public class MultiIndexBulkExample {    private final ElasticsearchClient esClient;    public MultiIndexBulkExample(ElasticsearchClient esClient) {        this.esClient = esClient;    }    /**     * 执行多索引批量操作     * @param personDataList 个人数据列表,将索引到 "person_index"     * @param addressDataList 地址数据列表,将索引到 "address_index"     * @param positionDataList 职位数据列表,将索引到 "position_index"     * @throws IOException 如果Elasticsearch操作失败     */    public void bulkSaveMultipleIndices(            List<Map> personDataList,            List<Map> addressDataList,            List<Map> positionDataList) throws IOException {        BulkRequest.Builder br = new BulkRequest.Builder();        // 添加person数据到 "person_index"        for (Map person : personDataList) {            br.operations(op -> op                .index(idx -> idx                    .index("person_index")                    .id(person.get("id").toString()) // 假设每个文档都有一个id字段                    .document(JsonData.of(person))                )            );        }        // 添加address数据到 "address_index"        for (Map address : addressDataList) {            br.operations(op -> op                .index(idx -> idx                    .index("address_index")                    .id(address.get("id").toString())                    .document(JsonData.of(address))                )            );        }        // 添加position数据到 "position_index"        for (Map position : positionDataList) {            br.operations(op -> op                .index(idx -> idx                    .index("position_index")                    .id(position.get("id").toString())                    .document(JsonData.of(position))                )            );        }        // 执行批量请求        BulkResponse result = esClient.bulk(br.build());        // 处理批量操作结果        if (result.errors()) {            System.err.println("Bulk operation had errors:");            for (BulkResponseItem item : result.items()) {                if (item.error() != null) {                    System.err.println("  " + item.error().reason());                }            }        } else {            System.out.println("Bulk operation completed successfully.");        }    }    // 示例用法 (需要初始化ElasticsearchClient)    public static void main(String[] args) throws IOException {        // 实际应用中,esClient应该通过依赖注入或配置来获取        // 例如:        // RestClient restClient = RestClient.builder(new HttpHost("localhost", 9200)).build();        // ElasticsearchTransport transport = new RestClientTransport(restClient, new JacksonJsonpMapper());        // ElasticsearchClient esClient = new ElasticsearchClient(transport);        // 假设我们已经有了esClient实例        ElasticsearchClient esClient = null; // 替换为实际的客户端实例        MultiIndexBulkExample service = new MultiIndexBulkExample(esClient);        // 准备示例数据        List<Map> persons = List.of(            Map.of("id", "p1", "name", "Alice", "age", 30),            Map.of("id", "p2", "name", "Bob", "age", 25)        );        List<Map> addresses = List.of(            Map.of("id", "a1", "street", "Main St", "city", "New York"),            Map.of("id", "a2", "street", "Park Ave", "city", "Los Angeles")        );        List<Map> positions = List.of(            Map.of("id", "pos1", "title", "Engineer", "department", "IT"),            Map.of("id", "pos2", "title", "Manager", "department", "HR")        );        // 调用批量保存方法        // service.bulkSaveMultipleIndices(persons, addresses, positions);        // 注意: 在实际运行前,请确保esClient已正确初始化    }}

代码说明:

BulkRequest.Builder 是构建批量请求的入口。br.operations(op -> op.index(…)) 方法用于向批量请求中添加一个索引操作。在 index 操作中,您需要指定目标索引名称(index(“index_name”))、文档ID(id(“document_id”))以及文档内容(document(JsonData.of(yourObject)))。JsonData.of() 可以将您的Java对象转换为Elasticsearch可接受的JSON格式。最后,通过 esClient.bulk(br.build()) 执行请求。

3.2 使用Elasticsearch Java Rest High-Level Client (已弃用,但仍广泛使用)

Elasticsearch Java Rest High-Level Client 是早期广泛使用的客户端,但自Elasticsearch 7.15.0起已被标记为弃用,并将在Elasticsearch 8.0.0中移除。尽管如此,许多现有项目仍在使用它。

使用此客户端,您需要构建一个 BulkRequest 对象,并向其添加多个 IndexRequest、UpdateRequest 或 DeleteRequest。

畅图 畅图

AI可视化工具

畅图 147 查看详情 畅图

import org.elasticsearch.action.bulk.BulkRequest;import org.elasticsearch.action.bulk.BulkResponse;import org.elasticsearch.action.index.IndexRequest;import org.elasticsearch.client.RequestOptions;import org.elasticsearch.client.RestHighLevelClient;import org.elasticsearch.common.xcontent.XContentType;import java.io.IOException;import java.util.List;import java.util.Map;public class MultiIndexBulkHighLevelClientExample {    private final RestHighLevelClient restHighLevelClient;    public MultiIndexBulkHighLevelClientExample(RestHighLevelClient restHighLevelClient) {        this.restHighLevelClient = restHighLevelClient;    }    /**     * 执行多索引批量操作     * @param personDataList 个人数据列表,将索引到 "person_index"     * @param addressDataList 地址数据列表,将索引到 "address_index"     * @param positionDataList 职位数据列表,将索引到 "position_index"     * @throws IOException 如果Elasticsearch操作失败     */    public void bulkSaveMultipleIndices(            List<Map> personDataList,            List<Map> addressDataList,            List<Map> positionDataList) throws IOException {        BulkRequest request = new BulkRequest();        // 添加person数据到 "person_index"        for (Map person : personDataList) {            request.add(new IndexRequest("person_index")                    .id(person.get("id").toString())                    .source(person, XContentType.JSON)); // 将Map转换为JSON        }        // 添加address数据到 "address_index"        for (Map address : addressDataList) {            request.add(new IndexRequest("address_index")                    .id(address.get("id").toString())                    .source(address, XContentType.JSON));        }        // 添加position数据到 "position_index"        for (Map position : positionDataList) {            request.add(new IndexRequest("position_index")                    .id(position.get("id").toString())                    .source(position, XContentType.JSON));        }        // 执行批量请求        BulkResponse bulkResponse = restHighLevelClient.bulk(request, RequestOptions.DEFAULT);        // 处理批量操作结果        if (bulkResponse.hasFailures()) {            System.err.println("Bulk operation had failures:");            // 遍历失败项            bulkResponse.forEach(bulkItemResponse -> {                if (bulkItemResponse.isFailed()) {                    System.err.println("  " + bulkItemResponse.getFailureMessage());                }            });        } else {            System.out.println("Bulk operation completed successfully.");        }    }    // 示例用法 (需要初始化RestHighLevelClient)    public static void main(String[] args) throws IOException {        // 实际应用中,restHighLevelClient应该通过依赖注入或配置来获取        // 例如:        // RestHighLevelClient restHighLevelClient = new RestHighLevelClient(        //     RestClient.builder(new HttpHost("localhost", 9200)));        // 假设我们已经有了restHighLevelClient实例        RestHighLevelClient restHighLevelClient = null; // 替换为实际的客户端实例        MultiIndexBulkHighLevelClientExample service = new MultiIndexBulkHighLevelClientExample(restHighLevelClient);        // 准备示例数据 (同上)        List<Map> persons = List.of(            Map.of("id", "p1", "name", "Alice", "age", 30),            Map.of("id", "p2", "name", "Bob", "age", 25)        );        List<Map> addresses = List.of(            Map.of("id", "a1", "street", "Main St", "city", "New York"),            Map.of("id", "a2", "street", "Park Ave", "city", "Los Angeles")        );        List<Map> positions = List.of(            Map.of("id", "pos1", "title", "Engineer", "department", "IT"),            Map.of("id", "pos2", "title", "Manager", "department", "HR")        );        // 调用批量保存方法        // service.bulkSaveMultipleIndices(persons, addresses, positions);        // 注意: 在实际运行前,请确保restHighLevelClient已正确初始化    }}

代码说明:

BulkRequest 对象用于聚合所有批量操作。request.add(new IndexRequest(“index_name”).id(“document_id”).source(yourObject, XContentType.JSON)) 方法用于添加一个索引操作。source() 方法可以接受各种类型的输入,例如Map、字符串或XContentBuilder。这里我们使用Map并指定 XContentType.JSON。最后,通过 restHighLevelClient.bulk(request, RequestOptions.DEFAULT) 执行请求。

4. 与Spring Data Elasticsearch的集成考量

Spring Data Elasticsearch 提供了一个高级抽象 ElasticsearchOperations,它简化了与Elasticsearch的交互。然而,ElasticsearchOperations 中的 bulkUpdate(List entities, Class entityClass) 等方法通常是针对单一实体类型和单一索引设计的。这意味着它们期望 entities 列表中的所有对象都属于 entityClass 类型,并且会索引到由 entityClass 定义的默认索引中。

当您需要执行真正意义上的“多索引、多类型”批量操作时,即一次性向多个不同索引写入不同类型的数据,ElasticsearchOperations 可能没有直接提供一个一站式的方法。在这种情况下,您需要:

获取底层Elasticsearch客户端: ElasticsearchOperations 通常会封装底层的Elasticsearch客户端(ElasticsearchClient 或 RestHighLevelClient)。您可以通过注入 ElasticsearchClient 或 RestHighLevelClient bean,或者如果 ElasticsearchOperations 提供了访问底层客户端的方法(例如,通过 ElasticsearchRestTemplate 获取),来直接使用它们。

// 假设您已经注入了ElasticsearchClient (对于新客户端)// @Autowired// private ElasticsearchClient esClient;// 或者 RestHighLevelClient (对于旧客户端)// @Autowired// private RestHighLevelClient restHighLevelClient;

手动构建BulkRequest: 按照上述第3节的示例,手动构建 BulkRequest,将不同类型、不同索引的操作添加到同一个请求中。

执行请求: 使用获取到的底层客户端执行构建好的 BulkRequest。

通过这种方式,即使在使用Spring Data Elasticsearch的项目中,您也可以灵活地利用Elasticsearch原生客户端的强大功能,实现复杂的多索引批量操作。

5. 批量操作的注意事项

在执行批量操作时,需要考虑以下几点以确保系统的稳定性、性能和数据完整性:

错误处理: 批量操作并非事务性的。这意味着即使请求中的某些操作失败,其他操作仍然可能成功。因此,在收到 BulkResponse 后,务必检查 result.errors() (新客户端) 或 bulkResponse.hasFailures() (旧客户端),并遍历 items() 或 forEach() 来识别并处理每个失败的子操作。批量大小: 合理设置批量请求的大小至关重要。过大: 可能导致内存溢出(客户端或Elasticsearch节点)、网络传输延迟增加、请求超时。过小: 导致频繁的网络往返,降低整体吞吐量。建议: 批量大小通常在几百到几千个文档之间,具体取决于文档大小、网络带宽和Elasticsearch集群的资源。最佳实践是通过测试和监控来确定最适合您场景的值。性能优化:异步执行: 对于对响应时间不敏感的场景,可以考虑异步执行批量请求,以避免阻塞主线程。线程池: 如果有大量数据需要批量处理,可以利用线程池并行发送多个批量请求。数据一致性: 批量操作是非事务性的。如果一个批量请求中的部分操作失败,您需要自行处理数据回滚或重试逻辑,以确保应用程序层面的数据一致性。Elasticsearch本身不提供跨文档或跨索引的事务保证。ID管理: 确保为每个文档提供唯一的ID。如果未提供,Elasticsearch会自动生成一个。但在更新或删除操作中,ID是必需的。

6. 总结

通过本教程,我们了解了Elasticsearch批量API的强大功能,它允许在单个请求中对多个不同索引执行数据操作,从而显著提高数据处理效率。我们详细展示了如何使用Elasticsearch Java API Client和Java Rest High-Level Client来构建和执行此类多索引批量请求,并讨论了与Spring Data Elasticsearch集成时的策略。

在实际应用中,通过将多个独立的数据列表聚合到一个 BulkRequest 中,您可以有效地减少网络往返次数,降低服务器负载,并优化应用程序的整体性能。同时,合理处理批量操作的响应和错误,并注意批量大小等性能考量,是构建健壮且高效的Elasticsearch集成方案的关键。

以上就是在Java中实现Elasticsearch多索引批量操作:优化单次请求的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/738628.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月25日 14:00:28
下一篇 2025年11月25日 14:01:58

相关推荐

  • Uniapp 中如何不拉伸不裁剪地展示图片?

    灵活展示图片:如何不拉伸不裁剪 在界面设计中,常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。 对于不同尺寸的图片,可以采用以下处理方式: 极端宽高比:撑满屏幕宽度或高度,再等比缩放居中。非极端宽高比:居中显示,若能撑满则撑满。 然而,如果需要不拉伸不…

    2025年12月24日
    400
  • 如何让小说网站控制台显示乱码,同时网页内容正常显示?

    如何在不影响用户界面的情况下实现控制台乱码? 当在小说网站上下载小说时,大家可能会遇到一个问题:网站上的文本在网页内正常显示,但是在控制台中却是乱码。如何实现此类操作,从而在不影响用户界面(UI)的情况下保持控制台乱码呢? 答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体,并通过在客户端…

    2025年12月24日
    800
  • 如何在地图上轻松创建气泡信息框?

    地图上气泡信息框的巧妙生成 地图上气泡信息框是一种常用的交互功能,它简便易用,能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。 利用地图库的原生功能 大多数地图库,如高德地图,都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现: 高德地图 JS API 参考文…

    2025年12月24日
    400
  • 如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画?

    如何实现元素scrollleft变化时的平滑动画效果? 在许多网页应用中,滚动容器的水平滚动条(scrollleft)需要频繁使用。为了让滚动动作更加自然,你希望给scrollleft的变化添加动画效果。 解决方案:scroll-behavior 属性 要实现scrollleft变化时的平滑动画效果…

    2025年12月24日
    000
  • 如何为滚动元素添加平滑过渡,使滚动条滑动时更自然流畅?

    给滚动元素平滑过渡 如何在滚动条属性(scrollleft)发生改变时为元素添加平滑的过渡效果? 解决方案:scroll-behavior 属性 为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码: click the button to slide right!…

    2025年12月24日
    500
  • 如何选择元素个数不固定的指定类名子元素?

    灵活选择元素个数不固定的指定类名子元素 在网页布局中,有时需要选择特定类名的子元素,但这些元素的数量并不固定。例如,下面这段 html 代码中,activebar 和 item 元素的数量均不固定: *n *n 如果需要选择第一个 item元素,可以使用 css 选择器 :nth-child()。该…

    2025年12月24日
    200
  • 使用 SVG 如何实现自定义宽度、间距和半径的虚线边框?

    使用 svg 实现自定义虚线边框 如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片,但是这种方法存在引入外部资源、性能低下的缺点。 为了避免上述问题,可以使用 svg(可缩放矢量图形)来创建纯代码实现。一种方…

    2025年12月24日
    100
  • 如何让“元素跟随文本高度,而不是撑高父容器?

    如何让 元素跟随文本高度,而不是撑高父容器 在页面布局中,经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中,父容器被较高的图片撑开,而文本的高度没有被考虑。本问答将提供纯css解决方案,让图片跟随文本高度,确保父容器的高度不会被图片影响。 解决方法 为了解决这个问题,需要将图片从文档流中脱离…

    2025年12月24日
    000
  • 为什么 CSS mask 属性未请求指定图片?

    解决 css mask 属性未请求图片的问题 在使用 css mask 属性时,指定了图片地址,但网络面板显示未请求获取该图片,这可能是由于浏览器兼容性问题造成的。 问题 如下代码所示: 立即学习“前端免费学习笔记(深入)”; icon [data-icon=”cloud”] { –icon-cl…

    2025年12月24日
    200
  • 如何利用 CSS 选中激活标签并影响相邻元素的样式?

    如何利用 css 选中激活标签并影响相邻元素? 为了实现激活标签影响相邻元素的样式需求,可以通过 :has 选择器来实现。以下是如何具体操作: 对于激活标签相邻后的元素,可以在 css 中使用以下代码进行设置: li:has(+li.active) { border-radius: 0 0 10px…

    2025年12月24日
    100
  • 如何模拟Windows 10 设置界面中的鼠标悬浮放大效果?

    win10设置界面的鼠标移动显示周边的样式(探照灯效果)的实现方式 在windows设置界面的鼠标悬浮效果中,光标周围会显示一个放大区域。在前端开发中,可以通过多种方式实现类似的效果。 使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

    2025年12月24日
    200
  • 为什么我的 Safari 自定义样式表在百度页面上失效了?

    为什么在 Safari 中自定义样式表未能正常工作? 在 Safari 的偏好设置中设置自定义样式表后,您对其进行测试却发现效果不同。在您自己的网页中,样式有效,而在百度页面中却失效。 造成这种情况的原因是,第一个访问的项目使用了文件协议,可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

    2025年12月24日
    000
  • 如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果?

    如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果 想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果,可以通过以下途径: CSS 解决方案 DEMO 1: Windows 10 网格悬停效果:https://codepen.io/tr4553r7/pe…

    2025年12月24日
    000
  • 使用CSS mask属性指定图片URL时,为什么浏览器无法加载图片?

    css mask属性未能加载图片的解决方法 使用css mask属性指定图片url时,如示例中所示: mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是,在网络面板中却…

    2025年12月24日
    000
  • 如何用CSS Paint API为网页元素添加时尚的斑马线边框?

    为元素添加时尚的斑马线边框 在网页设计中,有时我们需要添加时尚的边框来提升元素的视觉效果。其中,斑马线边框是一种既醒目又别致的设计元素。 实现斜向斑马线边框 要实现斜向斑马线间隔圆环,我们可以使用css paint api。该api提供了强大的功能,可以让我们在元素上绘制复杂的图形。 立即学习“前端…

    2025年12月24日
    000
  • 图片如何不撑高父容器?

    如何让图片不撑高父容器? 当父容器包含不同高度的子元素时,父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开,避免图片对其产生影响,可以通过以下 css 解决方法: 绝对定位元素: .child-image { position: absolute; top: 0; left: …

    2025年12月24日
    000
  • CSS 帮助

    我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

    2025年12月24日 好文分享
    200
  • 前端代码辅助工具:如何选择最可靠的AI工具?

    前端代码辅助工具:可靠性探讨 对于前端工程师来说,在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而,并非所有工具都能提供同等的可靠性。 个性化需求 关于哪个AI工具最可靠,这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素: 立…

    2025年12月24日
    300
  • 如何用 CSS Paint API 实现倾斜的斑马线间隔圆环?

    实现斑马线边框样式:探究 css paint api 本文将探究如何使用 css paint api 实现倾斜的斑马线间隔圆环。 问题: 给定一个有多个圆圈组成的斑马线图案,如何使用 css 实现倾斜的斑马线间隔圆环? 答案: 立即学习“前端免费学习笔记(深入)”; 使用 css paint api…

    2025年12月24日
    000
  • 如何使用CSS Paint API实现倾斜斑马线间隔圆环边框?

    css实现斑马线边框样式 想定制一个带有倾斜斑马线间隔圆环的边框?现在使用css paint api,定制任何样式都轻而易举。 css paint api 这是一个新的css特性,允许开发人员创建自定义形状和图案,其中包括斑马线样式。 立即学习“前端免费学习笔记(深入)”; 实现倾斜斑马线间隔圆环 …

    2025年12月24日
    100

发表回复

登录后才能评论
关注微信