使用logstash将MySQL数据导入到es-搜云库技术团队

前言

有个需求是对用户的name做模糊查询，数据大概2000万，mysql查询的太慢了，打算用es，导入数据就用了logstash，elk听说过，但是没用过，所以记录下

安装elk

之前写过装es的，但是看自己的去装居然失败了，看dockerhub的文档又装好了。

docker-compose安装es跟kibana

version: '2.2'
services:
  es01:
    image: elasticsearch:7.5.1
    container_name: es01
    restart: always
    environment:
      - node.name=es01
      - cluster.name=es-docker-cluster
      - discovery.seed_hosts=es02
      - cluster.initial_master_nodes=es01,es02
      - bootstrap.memory_lock=true
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"
    ulimits:
      memlock:
        soft: -1
        hard: -1
    volumes:
      - data01:/usr/share/elasticsearch/data
    ports:
      - 9200:9200
    networks:
      - elastic
  es02:
    image: elasticsearch:7.5.1
    container_name: es02
    restart: always
    environment:
      - node.name=es02
      - cluster.name=es-docker-cluster
      - discovery.seed_hosts=es01
      - cluster.initial_master_nodes=es01,es02
      - bootstrap.memory_lock=true
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"
    ulimits:
      memlock:
        soft: -1
        hard: -1
    volumes:
      - data02:/usr/share/elasticsearch/data
    networks:
      - elastic
  kibana:
    image: kibana:7.5.1
    container_name: kibana
    restart: always
    ports:
      - "5601:5601"
    environment:
      I18N_LOCALE: zh-CN #汉化
    networks:
      - elastic
    links:
      - es01:elasticsearch
volumes:
  data01:
    driver: local
  data02:
    driver: local
networks:
  elastic:
    driver: bridge

这样就装成功了

安装logstash

直接在官网看的教程，不过我是用docker-compose安装的，虽然我觉得用docker run好一点，但是用docker-compose可以记录命令，方便下次用

version: "2.0"
services:
  logstash:
    image: logstash:7.5.1
    container_name: logstash
    privileged: true
    environment:
      XPACK_MONITORING_ELASTICSEARCH_HOSTS: http://127.0.0.1:9200 
    volumes:
      - ./config:/usr/share/logstash/pipeline
    network_mode: host

我挂载了一个config目录，里面是启动脚本

input{
 jdbc{
        jdbc_connection_string => "jdbc:mysql://xxxx:3307/yogrt"
        jdbc_user => "xxx"
        jdbc_password => "xxx"
        ##这个包放在这个conf的同级目录mysql-account下，自动挂载到容器目录里
        jdbc_driver_library => "/usr/share/logstash/pipeline/mysql-account/mysql-connector-java.jar"
        jdbc_driver_class => "com.mysql.cj.jdbc.Driver"
        jdbc_paging_enabled => "true"
        jdbc_page_size => "500000"
        statement => "select id,name,avatar,lat,lon from account where id > :sql_last_value"
        schedule => "* * * * *"
        lowercase_column_names => false
        record_last_run => true
        use_column_value => true
        tracking_column => "id"
        tracking_column_type => "numeric"
        last_run_metadata_path => "/usr/share/logstash/pipeline/mysql-account/account_last_time"
        clean_run => false
     }
}
output{
      elasticsearch{
        index => "yogrt-account"
      }
}

这是复制的增量同步（感觉可以全量），不过我这是为了导数据，就测试一下。但是老数据发生修改还是需要到es改一下，logstash不是很熟，这里我需要研究下。然后是设置了schedule，一分钟一次说一下同步速度，外网一秒一万数据

数据导完后，因为拿不到数据，这里报错了，感觉需要处理下，但是最大值id已经记录了，待研究。

查询

测试了一下查询速度，相当快了，原谅我是个菜鸟，没见过世面

文章永久链接：https://tech.souyunku.com/42449

JetBrains 全家桶，激活、破解、教程

提供 JetBrains 全家桶激活码、注册码、破解补丁下载及详细激活教程，支持 IntelliJ IDEA、PyCharm、WebStorm 等工具的永久激活。无论是破解教程，还是最新激活码，均可免费获得，帮助开发者解决常见激活问题，确保轻松破解并快速使用 JetBrains 软件。获取免费的破解补丁和激活码，快速解决激活难题，全面覆盖 2024/2025 版本！

联系我们

前言

安装elk

docker-compose安装es跟kibana

安装logstash

查询

相关推荐

JetBrains 全家桶，激活、破解、教程