MySQL迁移到ClickHouse
admin
2024-01-30 13:52:03
0

     ClickHouse 新增 MaterializeMySQL引擎 ,可通过binlog日志实时物化mysql数据,提升数仓的查询性能和数据同步的时效性;原有mysql中承担的数据分析工作可交由clickhouse去做,这么做可显著降低线上mysql的负载,从此OLTP与OLAP业务实现完美融合。

   MaterializeMySQL 同步流程:

1.创建MySQL的映射表,在MaterializeMySQL引擎中填写MySQL连接信息(ip地址+端口+数据库名称+用户名+密码),ClickHouse会创建一个引擎为ReplacingMergeTree 的数据表,其中MySQL表的 PRIMARY KEY 作为了 ReplacingMergeTree 的 PARTITION BY,并且按照类型大小除以1000整除;
2.此时ClickHouse会拉取MySQL对象库下的所有表结构,并且添加_sign和_version字段,_sign字段表示数据是否删除,_version字段表示数据最新版本;
3.首次同步采用全量同步MySQL中的表数据,_version版本全为1;
4.后续采用增量同步消费binlog中的SQL,当ClickHouse监听到 insert、update 和 delete 事件时,利用_version号在 databse 内全局自增记录最新数据,当ClickHouse同步到delete语句时,更新_sign字段的值为-1(此时,熟悉MySQL的肯定会想到伪删除,对没错,它就是利用伪删除)。

   

服务器版本 centos7
mysql 版本        5.7.20-log
clickhouse22.7.3.5

在mysql的服务器的my.cnf , 增加log-bin配置

server-id=1
log_bin=binlog.bin
expire_logs_days=15
binlog_format=row
gtid-mode=on
enforce-gtid-consistency=true

测试结果如下

  • 在MySQL上创建一个表。

mysql> create database db1;mysql> create table test1 (a INT PRIMARY KEY, b INT);

  • 在ClickHouse上新建MaterializeMySQL的表。

# 这里要专门设置以便clickhouse能使用这个特性
ck> set allow_experimental_database_materialized_mysql=1;  
## 这里创建连接到user@172.30.1.17:3306/db1的database连接,命名为db1_ckck> CREATE DATABASE db1_ck ENGINE = MaterializeMySQL('172.30.1.17:3306', 'db1', 'root', '***');
## 进入db1_ck这个数据库ck> use db1_ck;
## 查看db1_ck库下的表,可以看到test1这个表ck> show tables;

  • 查看test1这个表在ck上的表结构。

ck> show create table test1;
CREATE TABLE db1_ck.test1(    `a` Int32,    `b` Nullable(Int32),    `_sign` Int8 MATERIALIZED 1,    `_version` UInt64 MATERIALIZED 1,    INDEX _version _version TYPE minmax GRANULARITY 1)ENGINE = ReplacingMergeTree(_version)PARTITION BY intDiv(a, 4294967)ORDER BY tuple(a)SETTINGS index_granularity = 8192

test1表使用的是ReplacingMergeTree引擎,表结构新增了两个字段_sign和_version作为隐藏字段,用于标识该行是否删除和版本号。这样将MySQL的update和delete统一转换成insert,充分利用ClickHouse快速导入数据、update和delete慢且容易出问题的特性。内部实现原理的细节和好处,我们将在另外一篇文章里面介绍。

  • 在MySQL上操作,看数据会不会同步到ClickHouse上。

mysql> insert into test1 values (1,11),(2,22),(3,33);mysql> update test1 set b=77 where a=1;mysql> delete from test1 where a=2;
ck> select * from db1_ck.test1;┌─a─┬──b─┐│ 1 │ 77 ││ 3 │ 33 │└───┴────┘

可以看到,数据基本都正确地同步到ClickHouse上去了。

查看所有数据

select *, _version,_sign  from test1;


┌─a─┬──b─┬─_version─┬─_sign─┐
│ 2     │ 22     │        4 │    -1 │
└───┴────┴──────────┴───────┘
┌─a─┬──b─┬─_version─┬─_sign─┐
│ 1      │ 77 │        3 │     1 │
└───┴────┴──────────┴───────┘
┌─a─┬──b─┬─_version─┬─_sign─┐
│ 1     │ 11 │        2 │     1 │
│ 2     │ 22 │        2 │     1 │
│ 3     │ 33 │        2 │     1 │
└───┴────┴──────────┴───────┘
 

相关内容

热门资讯

加拿大皇家银行(RY.US)任... 智通财经获悉,加拿大皇家银行(RY.US)财富管理宣布任命多位香港高级私人银行家。该银行声明称:“这...
2026白酒市场中期报告:86... 6月18日,在四川德阳绵竹举办的2026四川国际美酒博览会开幕式暨第三届中国酒业“华夏美学”大会上,...
推出隔夜逆回购操作工具,构建现... 文/冉学东 6月17日,央行行长潘功胜在陆家嘴金融论坛上表态,央行下一步将在2024年7月设立临时隔...
胖东来多款自营产品降价,工作人... 近日,有不少网友在社交平台发文称,胖东来多款自营产品下调了价格。 据大河报报道,6月17日下午,记者...
金价走低股价频现“腰斩” A股... 央广网北京6月18日消息(记者 谢碧鹭)2026年以来,全球贵金属市场上演了一场惊心动魄的行情,现货...
中国人如何在东南亚市场卖光储? 记者 潘俊田 “我们正按计划推进2030年可再生能源占比35%的目标,但在中东局势(美以伊冲突)紧张...
钉钉新任CEO陈宇森发布全员信... PChome 6月18日消息,据晚点LatePost报道,钉钉新任CEO陈宇森发布第一封全员信,他首...
四个年轻人,被马斯克以600亿... 《福布斯》估算,交易落地后,Cursor四位年轻亿万富豪创始人每人身家将达到27亿美元。 Curso...
今晚调油价 6月4日国内成品油价格调整以来,国际市场原油价格高位震荡后近日快速回落,本次调价的前10个工作日平均...
壹评级:啤酒需求持续磨底,成本... 5月数据显示啤酒行业整体动销偏弱,近期体育赛事对需求的拉动效果也不及预期。第一财经“壹评级”认为,当...
“618”牛奶价格战没有最低只... 2026年“618”大促进入最后冲刺阶段,战火也烧到了牛奶赛道。 记者在多个电商平台看到,今年各品牌...
上半年商务礼赠减八成?中酒协报... 本文自南都·湾财社 采写 | 南都·湾财社记者 贝贝 编辑 | 柴华 超8成企业反馈利润下滑、消费者...
博弈再升级!私募股东两度提议上... 本报(chinatimes.net.cn)记者李明会 北京报道 上市银行与中小股东之间的博弈再度升级...
日本提议下年度起对食品适用两年... 6月18日,财闻海外资讯消息,6月17日在日本讨论食品饮料消费税减税问题的跨党派社会保障国民会议上,...
范式智能在北京成立新公司 注册... 天眼查App显示,近日,范式矩阵(北京)控股有限公司成立,法定代表人为汤宗贵,注册资本1000万人民...
Momenta冲刺港股IPO,... Momenta冲刺港股IPO Momenta离港股更近了一步。 6月18日,Momenta取得中国证...
新乡经开科创集团拟发行3亿元公... 【大河财立方消息】6月18日,新乡经开科创集团有限公司2026年面向专业投资者非公开发行公司债券获上...
芯片板块上涨,科创芯片ETF涨... 芯片板块上涨,寒武纪涨超6%,带动科创芯片ETF广发、科创芯片ETF鹏华、科创芯片ETF易方达、科创...
数万亿元投向六张网 10万亿元... 【数万亿元投向六张网 10万亿元大市场要来了】财联社6月18日电,近日,“六张网”在网络刷屏,引发关...
首批商业不动产REITs在上交... 据上交所发布,2026年6月18日,首批商业不动产REITs上市仪式在上海证券交易所成功举行。本次上...