MySQL数据以全量和增量方式,向ES搜索引擎同步流程

一、配置详解

1、下载内容

Elasticsearch 版本:6.3.2Logstash 版本:6.3.2MySQL Connector:mysql-connector-java-5.1.13.jar

2、核心配置路径

路径:/usr/local/logstash新建配置目录:sync-config

1)、配置全文

配置文件路径:/usr/local/logstash/sync-config/cicadaes.conf

input {    stdin {}    jdbc {        jdbc_connection_string => "jdbc:mysql://127.0.0.1:3306/cicada?characterEncoding=utf8"        jdbc_user => "root"        jdbc_password => "root123"        jdbc_driver_library => "/usr/local/logstash/sync-config/mysql-connector-java-5.1.13.jar"        jdbc_driver_class => "com.mysql.jdbc.Driver"        jdbc_paging_enabled => "true"        jdbc_page_size => "50000"        jdbc_default_timezone => "Asia/Shanghai"        statement_filepath => "/usr/local/logstash/sync-config/user_sql.sql"        schedule => "* * * * *"        type => "User"        lowercase_column_names => false        record_last_run => true        use_column_value => true        tracking_column => "updateTime"        tracking_column_type => "timestamp"        last_run_metadata_path => "/usr/local/logstash/sync-config/user_last_time"        clean_run => false    }    jdbc {        jdbc_connection_string => "jdbc:mysql://127.0.0.1:3306/cicada?characterEncoding=utf8"        jdbc_user => "root"        jdbc_password => "root123"        jdbc_driver_library => "/usr/local/logstash/sync-config/mysql-connector-java-5.1.13.jar"        jdbc_driver_class => "com.mysql.jdbc.Driver"        jdbc_paging_enabled => "true"        jdbc_page_size => "50000"        jdbc_default_timezone => "Asia/Shanghai"        statement_filepath => "/usr/local/logstash/sync-config/log_sql.sql"        schedule => "* * * * *"        type => "Log"        lowercase_column_names => false        record_last_run => true        use_column_value => true        tracking_column => "updateTime"        tracking_column_type => "timestamp"        last_run_metadata_path => "/usr/local/logstash/sync-config/log_last_time"        clean_run => false    }}filter {    json {        source => "message"        remove_field => ["message"]    }}output {    if [type] == "User" {        elasticsearch {            hosts => ["127.0.0.1:9200"]            index => "cicada_user_search"            document_type => "user_search_index"        }    }    if [type] == "Log" {        elasticsearch {            hosts => ["127.0.0.1:9200"]            index => "cicada_log_search"            document_type => "log_search_index"        }    }}

2)、SQL文件

user_sql.sql

SELECT     id,    user_name userName,    user_phone userPhone,    create_time createTime,    update_time updateTimeFROM c_userWHERE update_time > :sql_last_value

log_sql.sql

SELECT     id,    param_value paramValue,    request_ip requestIp,    create_time createTime,    update_time updateTimeFROM c_logWHERE update_time > :sql_last_value

3)、配置参数说明

input参数

statement_filepath:读取SQL语句位置schedule:这里配置每分钟执行一次type:类型,写入ES的标识lowercase_column_names:字段是否转小写record_last_run:记录上次执行时间use_column_value:使用列的值tracking_column:根据写入ES的updateTime字段区分增量数据tracking_column_type:区分的字段类型

output参数

hosts:ES服务地址index:Index名称,类比理解数据库名称document_type:Type名称,类比理解表名称

3、启动进程

纳米搜索 纳米搜索

纳米搜索:360推出的新一代AI搜索引擎

纳米搜索 30 查看详情 纳米搜索

/usr/local/logstash/bin/logstash -f /usr/local/logstash/sync-config/cicadaes.conf

二、ES客户端工具

1、下载软件

Kibana 版本:kibana-6.3.2-windows-x86_64

2、修改配置

配置文件路径:kibana-6.3.2-windows-x86_64configkibana.yml

添加配置:

elasticsearch.url: "http://127.0.0.1:9200"

3、双击启动

启动文件路径:kibana-6.3.2-windows-x86_64binkibana.bat

4、访问地址

http://localhost:5601

MySQL数据以全量和增量方式,向ES搜索引擎同步流程

三、源代码地址

GitHub 地址:https://github.com/cicadasmile/linux-system-baseGitEE 地址:https://gitee.com/cicadasmile/linux-system-base

以上就是MySQL数据以全量和增量方式,向ES搜索引擎同步流程的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/265343.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月4日 10:22:43
下一篇 2025年11月4日 10:23:38

相关推荐

  • PyQt6并发编程:QThreadPool与QThread的选择与应用实践

    本文探讨了PyQt6应用中QThreadPool无法正常关闭导致窗口阻塞的问题。通过分析QThreadPool与QThread的设计理念与适用场景,指出QThreadPool主要用于管理大量轻量级并发任务,而对于单个或少量耗时任务,QThread提供了更直接且易于控制的线程生命周期管理能力。文章提供…

    2025年12月14日
    000
  • Django NoReverseMatch 错误解析与 URL 模式配置指南

    本文详细解析了 Django 项目中常见的 NoReverseMatch 错误,特别是当视图名称未在 URL 模式中正确定义时引发的问题。通过实例代码,文章阐述了如何诊断并修复此类错误,强调了在 urls.py 中为所有引用的 URL 名称配置对应路径的重要性,确保应用的路由功能正常运行,尤其是在用…

    2025年12月14日
    000
  • 解决 Django NoReverseMatch 错误:正确配置 URL 模式

    本文详细阐述了如何在 Django 项目中解决 NoReverseMatch 错误。当视图或模板中引用的 URL 名称未在项目的 urlpatterns 中定义时,就会出现此错误。通过分析一个具体的 ‘questions’ 视图案例,教程展示了如何通过在 urls.py 文件…

    2025年12月14日
    000
  • 使用Selenium从Google地图提取商家评分和评论数

    本文详细介绍了如何使用Selenium库从Google地图搜索结果中高效地提取商家评分和评论数量。教程涵盖了Selenium环境配置、动态页面滚动加载更多结果的策略、以及关键的元素定位技巧,特别是针对Google地图动态内容中评分和评论的准确XPath定位。通过示例代码和最佳实践,帮助读者掌握从复杂…

    2025年12月14日
    000
  • 使用Selenium从Google地图高效提取商家评分和评论数

    本教程详细指导如何使用Python和Selenium从Google地图页面提取商家(如花园)的评分和评论数量。文章聚焦于解决动态网页元素定位的常见问题,特别是如何通过相对XPath和稳健的定位策略,准确获取每个搜索结果的独立评分数据,并提供了完整的示例代码和关键注意事项,帮助初学者有效进行网页数据抓…

    2025年12月14日
    000
  • 解决 Django NoReverseMatch 错误:URL 模式配置详解

    本文深入探讨了 Django 中常见的 NoReverseMatch 错误,特别是当视图名称未在 URL 模式中正确定义时。通过一个具体的案例——在 Google OAuth 登录后重定向到“questions”视图时遇到的错误,文章详细解释了该错误的原因,并提供了在 urls.py 中添加缺失的 …

    2025年12月14日
    000
  • 使用Selenium从Google地图提取评分与评论数:一个实践指南

    本文旨在提供一个使用Selenium从Google地图动态加载页面中准确提取商家评分和评论数的教程。针对初学者在处理动态内容和构建稳定XPath定位器时常遇到的问题,文章详细阐述了如何通过相对XPath、父级元素定位以及条件判断来克服这些挑战,确保数据提取的准确性和代码的健壮性。 1. 环境准备与基…

    2025年12月14日
    000
  • 使用 Flet 在 Banner 中显示不同文本信息的教程

    本文将深入探讨在使用 Flet 构建 Python 应用时,如何根据不同条件在 Banner 组件中动态显示不同的文本信息。正如摘要所述,我们将介绍两种实现方法,分别是直接创建 Banner 对象和利用 UserControl 类封装 Banner 组件。 方法一:直接创建 Banner 对象 最直…

    2025年12月14日
    000
  • 使用 Flet 在 Python 中动态显示 Banner 消息

    本文档介绍了如何在 Flet 应用中动态地根据不同条件显示不同的 Banner 消息。我们将探讨两种实现方式:直接在条件语句中创建 Banner 对象,以及使用类来封装 Banner 的创建和管理,从而提高代码的可维护性和可读性。通过本文,你将掌握在 Flet 应用中灵活运用 Banner 组件来提…

    2025年12月14日
    000
  • Python中如何处理JSON Schema?数据验证

    1.安装jsonschema库用于python中json schema的数据验证。2.定义描述数据结构的schema字典或json对象。3.使用validate函数验证数据是否符合schema,异常处理错误信息。4.通过enum、pattern等字段实现性别限制、手机号格式等自定义校验规则。5.在a…

    2025年12月14日 好文分享
    000
  • Python中如何操作LDAP?python-ldap配置

    1.安装python-ldap需处理依赖;2.核心流程包括初始化连接、绑定、执行操作、关闭连接;3.配置ssl/tls时注意证书验证与加密设置;4.搜索操作需掌握过滤器语法、范围选择与属性解码;5.修改操作使用modlist生成修改列表,注意编码、权限与dn格式;6.优化实践包括连接复用、分页搜索、…

    2025年12月14日 好文分享
    000
  • 使用Python进行数据导入、读取与简单线性回归

    本文档旨在指导读者如何使用Python导入并读取Excel数据集,以及如何利用Pandas和Scikit-learn库进行简单的线性回归分析。内容涵盖文件路径处理、数据读取、数据预处理以及线性回归模型的构建与评估。通过本文,读者将掌握使用Python进行基本数据分析和建模的流程。 1. 数据导入与读…

    2025年12月14日
    000
  • 使用 Python 上传数据集、读取数据并进行简单线性回归

    本文档旨在指导读者使用 Python 上传和读取数据集,并使用 Pandas 库进行简单线性回归分析。主要内容包括使用 Pandas 读取 Excel 文件,并演示如何构建一个简单的线性回归模型,其中涉及数据预处理、模型训练和结果展示的关键步骤。 1. 数据读取与准备 首先,我们需要使用 Panda…

    2025年12月14日
    000
  • 使用Python上传、读取数据集并进行简单线性回归

    本文档旨在指导读者如何使用Python上传并读取Excel数据集,并在此基础上进行简单的线性回归分析。主要涉及pandas库的数据读取和处理,以及sklearn库的线性回归模型应用。通过本文,读者可以掌握数据导入、数据预处理以及简单线性回归建模的基本流程。 1. 数据导入与读取 首先,我们需要使用p…

    2025年12月14日
    000
  • 如何使用Python开发CLI工具?Click库最佳实践

    click库是开发python cli工具的首选,其优势体现在参数解析、子命令管理和错误处理等方面。使用click开发cli工具的步骤包括:1. 安装click;2. 使用@click.command()装饰器定义命令;3. 使用@click.option()或@click.argument()定义…

    2025年12月14日 好文分享
    000
  • 解决OpenGL浮点精度输出问题:深度解析与Framebuffer对象应用

    本文深入探讨了OpenGL中从片段着色器读取浮点值时遇到精度丢失或数值不准确的问题。核心原因在于默认帧缓冲区的内部格式通常限制了浮点数据的存储范围和精度。为解决此问题,教程详细介绍了如何利用帧缓冲区对象(FBO)创建自定义的浮点纹理作为渲染目标,从而确保高精度浮点计算结果能够被准确地存储和回读。通过…

    2025年12月14日
    000
  • 如何使用Python处理XML?ElementTree解析

    elementtree是python处理xml的首选工具,因为它内置标准库,无需额外安装;api简洁直观,适合日常xml解析和生成需求;性能良好且功能够用。其核心流程包括:1. 解析xml数据,支持字符串或文件解析;2. 导航和查找元素,通过find、findall等方法实现遍历和查询;3. 修改数…

    2025年12月14日 好文分享
    000
  • FastAPI 类型转换:字符串到布尔值的优雅实现

    本文介绍了如何在 FastAPI 应用中,将外部服务传递的字符串参数(如 “true”、”false”、”yes”、”no” 等)自动转换为布尔类型。通过自定义 Pydantic 验证器,我们能够灵活地处…

    2025年12月14日
    000
  • FastAPI/Pydantic中灵活处理字符串到布尔值的智能转换

    本文详细介绍了如何在FastAPI应用中,利用Pydantic的自定义验证器(PlainValidator和Annotated),将多种形式的字符串(如”true”、”false”、”yes”、”no”、…

    2025年12月14日
    000
  • FastAPI 中实现字符串到布尔值的类型转换

    本文将详细介绍如何在 FastAPI 应用中,优雅地实现字符串到布尔值的类型转换。在实际开发中,我们经常需要接收来自外部服务的请求,这些请求可能携带字符串类型的参数,而我们的应用需要将其转换为布尔类型进行处理。例如,一个查询参数可能传递 “true” 或 “fal…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信