MySQL数据闪回 binlog2sql

  • 官方链接:https://github.com/danfengcao/binlog2sql

  • 相比于全备+binlog恢复,flashback 是动作更小的恢复方式。简单来说就是通过工具解析 binlog 生成与误操作相反的SQL,比如 delete 则反向生成 insert,再执行一遍即可恢复数据。第一个实现该功能的是彭立勋,他在 MySQL 5.5 版本上实现,并将其提交给 MariaDB,Oracle MySQL 并没有推出这个功能,由于跟版本绑定比较深,使用上不是很广泛。美团点评陆续也开发了两款开源工具:binlog2mysqlMyFlash,比较受欢迎。

  • 闪回的要求与限制:

    • 要求binlog_format = row格式,且binlog_row_image = full
    • 只支持DML的闪回,不支持DDL
  • 目前支持版本

    • MySQL 5.6, 5.7

一、安装工具

  • binlog2sql 基于python,支持2.73.4+版本,因此需要执行该工具的环境已安装 python 环境,然后再进行软件的安装。
[root@centos ~]# yum -y install git python-pip
[root@centos ~]# git clone https://github.com/danfengcao/binlog2sql.git
[root@centos ~]# cd binlog2sql/
[root@centos binlog2sql]# pip install -r requirements.txt

二、模拟数据误删除

  • 模拟 id23 的两行数据被误删除

  • 执行 flush logs; 是为了更加直观的写文档,这一步可以忽略。

mysql> flush logs;
Query OK, 0 rows affected (0.04 sec)

mysql> select * from t1;
+------+------+
| id   | name |
+------+------+
|    1 | aa   |
|    2 | bb   |
|    3 | cc   |
+------+------+
3 rows in set (0.00 sec)

mysql> delete from t1 where id in (1,2);
Query OK, 2 rows affected (0.00 sec)

mysql> select * from t1;
+------+------+
| id   | name |
+------+------+
|    3 | cc   |
+------+------+
1 row in set (0.00 sec)
  • 查看当前误删除时 binlog 文件名( 一般不需要大概位置的 position 位点或 GTID 事务号,因为可以使用时间来选中日志范围 )
mysql> show master status;
+------------------+----------+--------------+------------------+-----------------------------------------------+
| File             | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set                             |
+------------------+----------+--------------+------------------+-----------------------------------------------+
| mysql-bin.000006 |      521 |              |                  | 049f1f26-dd03-11ea-bc16-02000aba3c36:1-106260 |
+------------------+----------+--------------+------------------+-----------------------------------------------+
1 row in set (0.00 sec)

三、查看误删除时间执行的DML语句

  • 查看误操作时间段内执行的DML语句( 假设误操作在 14:00-14:20 )

  • 每一个 SQL 后都有 position 位点信息( start 259 end 490

[root@centos binlog2sql]# python ./binlog2sql/binlog2sql.py -h 10.186.60.54 -P 3306 -u root -p 123456 -d testdb -t t1 --start-file='mysql-bin.000006' --start-datetime='2020-08-13 14:00:00' --stop-datetime='2020-08-13 14:20:00'
DELETE FROM `testdb`.`t1` WHERE `id`=1 AND `name`='aa' LIMIT 1; #start 259 end 490 time 2020-08-13 14:17:39
DELETE FROM `testdb`.`t1` WHERE `id`=2 AND `name`='bb' LIMIT 1; #start 259 end 490 time 2020-08-13 14:17:39

四、生成回滚SQL语句

  • 根据上一步获取到的准确 postion 位点信息,生成回滚语句。
[root@centos binlog2sql]# python ./binlog2sql/binlog2sql.py -h 10.186.60.54 -P 3306 -u root -p 123456 -d testdb -t t1 --flashback --start-file='mysql-bin.000006' --start-position='259' --stop-position='490' > /tmp/mysql_flashback_testdb_t1.sql
[root@centos binlog2sql]# cat /tmp/mysql_flashback_testdb_t1.sql
INSERT INTO `testdb`.`t1`(`id`, `name`) VALUES (2, 'bb'); #start 259 end 490 time 2020-08-13 14:17:39
INSERT INTO `testdb`.`t1`(`id`, `name`) VALUES (1, 'aa'); #start 259 end 490 time 2020-08-13 14:17:39

五、数据恢复

  • 由业务方确认待回滚的 SQL 语句内容完全正确后,登录MySQL客户端执行导入。

  • 在数据恢复时,要记得关闭 binlog 日志记录,防止 binlog 日志被污染。

  • 当前测试 id 字段不是自增主键,所以闪回数据后 id 字段数字为倒序的( 如果 id 字段是自增主键,那么会数据闪回后顺序是递增的,不会紊乱的。 )

mysql> use testdb;
Database changed

mysql> set sql_log_bin = off;
Query OK, 0 rows affected (0.00 sec)

mysql> source /tmp/mysql_flashback_testdb_t1.sql;
Query OK, 1 row affected (0.01 sec)

Query OK, 1 row affected (0.00 sec)

# 数据验证
mysql> select * from testdb.t1;
+------+------+
| id   | name |
+------+------+
|    3 | cc   |
|    2 | bb   |
|    1 | aa   |
+------+------+
3 rows in set (0.00 sec)

六、参数解释

# python binlog2sql/binlog2sql.py --help

MySQL连接配置
-h host; -P port; -u user; -p password

解析模式
--stop-never          持续解析binlog。可选。,默认False,同步至执行命令时最新的binlog位置。
-K, --no-primary-key  对INSERT语句去除主键。可选。默认False
-B, --flashback       成回滚SQL,可解析大文件,不受内存限制。可选。默认False。与stop-never或no-primary-key不能同时添加。
--back-interval       B模式下,每打印一千行回滚SQL,加一句SLEEP多少秒,如不想加SLEEP,请设为0。可选。默认1.0。

解析范围控制
--start-file          起始解析文件,只需文件名,无需全路径 。必须。
--start-position      /--start-pos 起始解析位置。可选。默认为start-file的起始位置。
--stop-file           /--end-file 终止解析文件。可选。默认为start-file同一个文件。若解析模式为stop-never,此选项失效。
--stop-position       /--end-pos 终止解析位置。可选。默认为stop-file的最末位置;若解析模式为stop-never,此选项失效。
--start-datetime      起始解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。
--stop-datetime       终止解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。

对象过滤
-d, --databases       只解析目标db的sql,多个库用空格隔开,如-d db1 db2。可选。默认为空。
-t, --tables          只解析目标table的sql,多张表用空格隔开,如-t tbl1 tbl2。可选。默认为空。
--only-dml            只解析dml,忽略ddl。可选。默认TRUE。
--sql-type            只解析指定类型,支持INSERT, UPDATE, DELETE。多个类型用空格隔开,如--sql-type INSERT DELETE。可选。默认为增删改都解析。用了此参数但没填任何类型,则三者都不解析。
  • 建议 MySQL 二进制日志参数
# 在配置文件my.cnf的mysqld这个区下设置
[mysqld]
server_id = 1
log_bin = /data/mysql/log/binlog/3306/mysql-bin
max_binlog_size = 256M
binlog_format = row
binlog_row_image = full

# 在运行中的mysql中查看
show variables like 'server_id';
show variables like 'log_bin%';
show variables like 'max_binlog_size';
show variables like 'binlog_format';
show variables like 'binlog_row_image';
  • 用来闪回数据的用户需要的最小权限集合
# 建议授权
# select, super/replication client, replication slave
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO repl@'localhost' identified by '123456';

# select:需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句
# super/replication client:两个权限都可以,需要执行'SHOW MASTER STATUS', 获取server端的binlog列表
# replication slave:通过BINLOG_DUMP协议获取binlog内容的权限
「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论