云时代,MySQL到ClickHouse数据同步产品对比推荐

yizhihongxing

ClickHouse 在执行分析查询时的速度优势很好的弥补了 MySQL 的不足,但是对于很多开发者和DBA来说,如何将MySQL稳定、高效、简单的同步到 ClickHouse 却很困难。本文对比了 NineData、MaterializeMySQL(ClickHouse自带)、Bifrost 三款产品,看看他们在同步时的差异。

对比结果概述

整体上,NineData(官网:https://www.ninedata.cloud/ )的数据复制功能在功能、性能表现最突出。其次是Bifrost和ClickHouse自带的MaterializeMySQL。NineData在增量DDL的处理、字段映射的准确性、无主键表、以及功能丰富度上最强(数据校验、过滤、限流等),详细的对比如下图:

云时代,MySQL到ClickHouse数据同步产品对比推荐

MySQL到ClickHouse数据同步产品对比结果概述

结构映射对比

在做了详细对比之后,对于基础类型,只有NineData考虑的更加完整,例如MySQL的datetime需要映射到ClickHouse的DateTime64,否则则可能出现数据丢失。如果使用Biforst或MaterializeMySQL等其他产品均映射到datetime可能会造成一定程度的数据精度丢失。

此外,在对比了MySQL全部数据类型之后,发现NineData支持更完整,例如对JSON类型、几何数据、地理信息仅NineData支持。此外,对于基础类型,也只有NineData考虑更加细致,使用Biforst或MaterializeMySQL等其他产品则可能导致精度丢失,从而造成数据丢失。

详细的对比如下图:

云时代,MySQL到ClickHouse数据同步产品对比推荐

无主键表支持

NineData对记录做了特殊的标记处理,所以很好的支持了无主键表的数据同步。而MaterializeMySQL、Biforst均不支持。

详细的对比如下图:

云时代,MySQL到ClickHouse数据同步产品对比推荐

无主键表支持情况

增量DDL

对于数据增量同步,支持好各种类型的DDL是保障同步链路持续稳定的关键,NineData在无主键表DDL支持、字段删除、字段名修改等特殊操作均做了适配处理,可以很好的保障复制链路的问题。同时,NineData还提供了可视化的错误修复和跳过功能,可以最大限度的保障链路持续稳定。

详细的对比如下图:

云时代,MySQL到ClickHouse数据同步产品对比推荐

增量DDL对比结果

限流、对比、过滤等

除了前面介绍的一般功能之外,为了提升数据质量、保障稳定,NineData还支持了包括数据对比、运行中的限流、数据过滤等功能。具体的说明如下:

云时代,MySQL到ClickHouse数据同步产品对比推荐

增量DDL 限流、对比、过滤等对比结果

同步性能对比

这里使用 sysbench工具生成了5000万行记录进行全量性能对比,再生成约1800万次DML(约5GB Binlog)进行增量性能对比。

对比中,全量同步 NineData 性能为36.2W RPS(每秒同步记录数)为最高;增量同步则是 ClickHouse 自带的同步工具 MaterializeMySQL 最高,需要注意,MaterializeMySQL 在错误处理上比较简单,如果报错则需要全部重新同步。

详细的对比如下:

  • 全量同步

通过sysbench生成10张表,每张表500W记录(5000W行),数据文件大小约为12G:

云时代,MySQL到ClickHouse数据同步产品对比推荐

同步性能对比

  • 增量同步

通过sysbench生成5G大小的BinLog日志(约1800W次DML),再进行增量同步:

云时代,MySQL到ClickHouse数据同步产品对比推荐

增量同步

总结

NineDatahttps://www.ninedata.cloud/)在功能上领先其他同步工具,特别是字段类型的全面适配和增量复制期间DDL的支持度,并且在动态限流、数据对比、监控等能力上也支持的最完善。

所以,如果想把MySQL的数据实时同步到ClickHouse,推荐使用NineData,不仅使用简单(SaaS),并在满足功能和性能的前提下,实现了字段类型的无损转换和数据的实时复制,很好的解决MySQL 同步数据到ClickHouse的问题。

补充说明

当前各个云厂商虽然都提供ClickHouse托管服务,但是另一方面云厂商又都在发展自己的数仓产品,在同步功能支持上通常仅对自家的数仓产品支持比较好,而对ClickHouse同步支持都很薄弱。此外,开源工具Canal也因为不能很好的支持结构同步,使用和维护起来并不方便。

原文链接:https://www.cnblogs.com/ninedata/p/17332783.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:云时代,MySQL到ClickHouse数据同步产品对比推荐 - Python技术站

(0)
上一篇 2023年4月19日
下一篇 2023年4月19日

相关文章

  • 6G数据库的导入 报各种错误的解决办法

    下面是“6G数据库的导入报各种错误的解决办法”的完整攻略。 导入6G数据库前准备工作 在导入6G数据库之前,需要先确保准备工作已经完成,主要包括以下几个方面: 安装MySQL或MariaDB数据库,确保版本不低于5.7。 下载6G数据库备份文件,解压缩文件到本地。 为导入6G数据的MySQL或MariaDB账号授予合适的权限。 将备份文件导入到数据库前,可以…

    MySQL 2023年5月18日
    00
  • MySQL中的异常处理

      与java中的异常一样,都是用来定义在处理过程中遇到的问题以及相应的处理方式。 2,自定义异常及处理方式   1,自定义异常语句     DECLARE condition_name CONDITION FOR condition_value;     condition_name:是自己起的名字,最好见名知意。     condition_value:…

    MySQL 2023年4月13日
    00
  • 【MySQL】索引和锁

    前言 本文摘自数据库两大神器【索引和锁】 InnoDB存储引擎 索引 在之前,我对索引有以下的认知: 索引可以加快数据库的检索速度 表经常进行INSERT/UPDATE/DELETE操作就不要建立索引了,换言之:索引会降低插入、删除、修改等维护任务的速度。 索引需要占物理和数据空间。 了解过索引的最左匹配原则 知道索引的分类:聚集索引和非聚集索引 Mysql…

    MySQL 2023年4月12日
    00
  • MySQL查看和修改事务隔离级别

    MySQL中的事务隔离级别是指多个事务同时操作同一个数据库对象时,数据库会采取一定的机制来避免数据之间的混乱,保证每个事务操作的数据的一致性和完整性。MySQL提供了4种不同的事务隔离级别,它们分别是READ UNCOMMITTED、READ COMMITTED、REPEATABLE READ和SERIALIZABLE。下面详细介绍如何查看和修改MySQL的…

    MySQL 2023年3月10日
    00
  • MySQL基础教程之事务异常情况

    MySQL是一款常用的关系型数据库管理系统,而事务则是MySQL数据库中的一个非常重要的概念。在事务的处理过程中,可能会出现一些异常情况,如果不加以处理,就会对系统的数据完整性造成影响。因此掌握事务的错误处理以及异常情况的处理是做好MySQL数据库开发和维护的关键。 事务异常情况概述 在MySQL中,事务通常有四种异常情况: 1. 回滚(Rollback) …

    MySQL 2023年5月18日
    00
  • windows上安装mysql5.7

    安装前准备: 系统:windows7-x64 MySql:mysql5.7.19-X64-windows压缩包 安装步骤: 在windows上安装mysql有两种方式,一种是安装mysql压缩包,一种是图形化的安装,只要是配置好my.ini配置文件,压缩包安装比图形化更快更简单。这篇文章主要说明mysql压缩包的安装步骤。 一、新建数据库文件存放目录 将my…

    MySQL 2023年4月12日
    00
  • 解压版MYSQL安装及遇到的错误及解决方法

    解压版MYSQL安装和遇到的错误及解决方法 安装步骤 下载解压版的MySQL安装包,官方地址:https://dev.mysql.com/downloads/mysql/ 将压缩包解压到指定目录中,如:D:\mysql 进入MySQL目录,在该目录下新建my.ini文件,并添加以下内容: ini [mysqld] # 设置MySQL安装目录 basedir=…

    MySQL 2023年5月18日
    00
  • MySQL表锁、行锁和页锁

    MySQL中的锁机制可以分为两种类型:表锁和行锁。表锁是在一整个MySQL表上进行加锁,而行锁是在表的某一行数据上进行加锁。此外,MySQL还提供一种称为页锁的锁机制,它是在表的某一页上进行加锁。 表锁 表锁是对整个MySQL表进行锁定。当对一个表进行读或写操作时,如果该表已被其他进程加锁,则会等待解锁后再执行操作。 表锁具有以下优点: 简单:表锁简单易用,…

    MySQL 2023年3月10日
    00
合作推广
合作推广
分享本页
返回顶部