概述

今天,我将重点介绍MySQL的binlog机制和对binlog的一些分析。

下面一起看看吧~


一、redolog和binlog

1、简单对比

  • redolog记录的是对于每个页的修改
  • binlog只是记录DML、DDL、DCL,不记录SELECT

2、图解redolog、binlog机制

网上看到一张图讲的不错,这里分享下:

在oracle里面虽然redolog也是循环覆盖的,但是在循环覆盖之前,数据库会将redo拷贝出来做个归档,所以oracle里可以用redolog做数据恢复。


二、开启binlog及分析

1、开启binlog

修改配置文件/etc,在[mysqld]下添加:

这是我的binlog配置,可以参考下

binlog的启动大概会为mysql增加1%的负载,因此在绝大多数情况下,binlog都不会成为mysql的性能瓶颈,所以一般都是会开启binlog的。

2、手工切换binlog

1)重启数据库

每次重启都会新切binlog

2)命令

mysql> flush logs;

3、查看binlog日志文件

#mysqlbinlog -vv my


三、binlog相关参数

1、binlog_cache_size

//设置binlog cache(默认32K),每个线程单独分配内存空间

所有未提交的二进制日志文件会被记录到用户工作空间的binlog cache中,等该事务提交时直接将缓冲区中的binlog写入二进制日志文件里

mysql> show global status like 'Binlog_cache_disk_use';

判断binlog_cache_size是否设置过小的依据,如果Binlog_cache_disk_use>0(次数),说明事务未提交,binlog在用户工作空间存放不下,需要借用tmp目录。

2、log_bin

//设置名字前缀

–log-bin [=file_name]:设置此参数表示启用binlog功能,并指定路径名称,生产中都要开启binlog。

sql_log_bin:会话级别的binlog开关控制,默认是开启的,可以在当前会话级别动态修改临时关闭binlog(主从延迟优化),set session sql_log_bin=0;

3、sync_binlog

//同步binlog的方式

  • 0:默认,提交同步到文件系统缓存
  • 1:commit,通过fsync方式,直接写入disk的binlog文件中(最安全),与redo的双一模式。
  • >1:sync_binlog=N,如果N>1,在意外发生的时候,就表示会有N-1个dml没有被写入binlog中,有可能就会发生主从数据不一致的情况。

4、max_binlog_size

//binlog文件大小,默认1G

如果是row模式,需要增加binlog文件的大小,因为行模式产生的日志量相对较大。如果超过了该值,就会产生新的日志文件,后缀名+1,并且记录到.index文件里面。

5、binlog_format

//row、statement、mixed,设置binlog记录的模式:行模式、语句模式、mixed模式。动态参数,可以会话级别修改

6、–binlog-do-db、–binlog-ingore-db

//command-line format,表示需要写入或者忽略写入哪些库的日志,默认为空,表示可以将所有库的日志写入到二进制文件里面。

7、log-slave-updates

//启用从机服务器上的slave日志功能,使这台计算机可以用来构成一个镜像链(A->B->C) ,可以让从库上面产生二进制日志文件,在从库上再挂载一个从库。

8、binlog_rows_query_log_events

//便于定位执行过的sql语句

9、expire_logs_days

//binlog过期清理时间,默认是0:不自动清除

binlog的删除策略,假设expire_logs_days=5,表示系统保留5天binlog,第六天到来时会删除第一天的binlog。


四、binlog_format

1、STATEMENT

每一条会修改数据的sql都会记录在binlog中。

优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。只需要记录在 master 上所执行的语句的细节,以及执行语句时候的上下文的信息。

缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同的结果。像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数,rand()函数等会出现问题warning)。

2、ROW

不记录sql语句上下文相关信息,仅保存哪条记录被修改,也就是说日志中会记录成每一行数据被修改的形式,然后在 slave 端再对相同的数据进行修改。

优点:binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题。

缺点:在 row 模式下,所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容。

3、MIXED

是以上两种level的混合使用,一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种;

新版本的MySQL中对row模式也被做了优化,并不是所有的修改都会以rowl来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。


总结

mysql binlog日志在备份恢复方面是很重要的一个环节,一定要重点掌握。后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注一下~

相关推荐