当前位置:首页 > 短网址资讯 > 正文内容

一次MySQL5.7线上故障分析

www.ft12.com8年前 (2017-07-21)短网址资讯2318

坑都是踩出来的。


MySQL 5.7 GA已经有很长一段时间了,经过测试评估,在5.7.16版本release之后,我们开始在生产线上规模部署,一个多月相安无事,心中窃喜,在部署了大约200+实例之后,天有不测风云,故障开始接二连三。

某日,一个从库报OOM。该实例的innodb_buffer_pool_size = 40G,而系统内存是64G,怎么就能OOM了呢,先下线该实例,再看情况:


1、机器内存: 基本快要跪了

   total    used    free    shared    buffers    cached
Mem:    65808000    65492564    315436    0    1648    247284
-/+ buffers/cache: 65243632    564368
Swap:    2088952    2087852    1100

2、看谁是元凶:确认是mysqld

PID    USER    PR    NI    VIRT    RES    SHR S %CPU %MEM    TIME+  COMMAND    
28086 mysql    20    0 87.3g    61g 5192 S 21.2 97.7  28226:23 mysqld

3、看MySQL监控:

com_delete/innodb_rows_deleted : 29/9340
com_update/innodb_rows_updated : 155/9740
com_select/innodb_rows_selected : 299/39400

该业务正常情况下是不可能出现这么大的innodb_rows值的,先stop slave,com_delete/com_update/com_select的值变0,但是innodb_rows值并没有降低,什么!!!现在已经没有任何写入了,怎么可能,诡异了。

4、再看看LSN: 还在涨?


5、再看看是否有事务在回滚(此处感谢@张远 ^_^):

确实有线程在rollback,但是该实例也没有什么大事务,stop slave都已经好久了,为什么还在回滚呢?


6、pstack $mysqldpid看看线程都在干什么:

从下图能看出都是在compress_gtid_table()里,难道短网址和gtid compress有关系?

插入一段关于gtid compress的介绍: MySQL 5.7中新增了一个mysql.gtid_executed表,用于记录当前执行过的gtid,在binlog开启的情况下,当binlog retation的时候会唤醒一个内部线程对这个表的数据进行压缩合并。




7、看下mysql.gtid_executed表的情况:

果然是没有压缩,看来是在压缩这个表数据的时候出错了,然后产生了回滚操作。


8、经过对比,最后确认是这个参数引起的:

我们为了防止有DBA不小心在从库上执行SQL,给gtid_mode=on的复制模式留下隐患,将super_read_only设置成了on,为此,还特意修改了MHA的源码,以便检测和支持短网址的这个设置,结果人算不如天算,踩上了这个坑。将super_read_only 设置成0,当binlog retation后可以看到mysql.gtid_executed的compress恢复正常了,innodb_rows也正常了:



9、写在最后也是最重要的:


a) 参数的调整尽管已经解决了这个问题,但是更深层次的原因还没去找,希望有MySQL源码基础的同学,有兴趣来帮忙填坑的,请将简历砸过来: zouyu@didichuxing.com;

b) 还有一个MySQL5.7.16发生写入夯死的坑未填上,速来!^_^


扫描二维码推送至手机访问。

版权声明:本文由短链接发布,如需转载请注明出处。

本文链接:https://www.ft12.com/article_317.html

标签: MySQLBUG调试
分享给朋友:

相关文章

FT12短网址:干事业不是先有钱,而是先有胆!

FT12短网址:干事业不是先有钱,而是先有胆!

胆量决议财富1、想常人之不敢想,做常人之不敢做2、不拼,怎么知道不行3、有没有勇气走出第一步,往往是人生的分水岭4、人的成功是被冒险逼出来的5、不冒险即是最大的冒险,咱们坚决不做老实人6、惧怕失利,就等于回绝成功7、要想知道梨子的滋味,就要...

全方位分析“深度学习与人工智能”的趋势走向

全方位分析“深度学习与人工智能”的趋势走向

行业剖析2016年,全球深度学习商场规模据估计已达到2.27亿美元。跟着在自动驾驶和医疗健康工业的运用不断增加,深度学习应该仍会对职业添加带来突出的贡献。它在技能上战胜数据量、强计算力以及在数据存储能力方面的优势,使得其在语音、图像等对数据...

FT12短网址:人与人的差距是怎么拉开的?

疑问:俞老师好,人与人之间的距离是怎么摆开的?每个人都有一个头脑,两只手、两条腿,但随着时刻的推移,即使是同一个社会层次,在同一个校园读书的人,最终的间隔都会拉得越来越大,有的人走向平凡,有的人则不断走向成功,你以为这里面最首要的因素是什么...

用短网址进行推广是隐藏链接吗?是否会传递权重?

用短网址进行推广是隐藏链接吗?是否会传递权重?

是否会传递权重?首先你得清楚短网址的跳转是什么跳转,比如百度短网址,比如微博生成的短网址,都是302跳转,无法传递权重.PS:302是临时性的跳转,不但不会传递权重,过多的302还可能会被搜索引擎误杀,因为以前很多黑帽SEO利用302跳转作...

可以原谅,但不再信任!

可以原谅,但不再信任!

如果有人伤害了你,可以原谅他,但永远也不要再相信他。原谅是放过你自己,而盲目信任却只会给他再伤害你的机会。我们当然可以相信人会改过,但验证的机会就留给别人吧。那些伤害过你的人,放过他们,路过他们,挥挥手永不再见。即使生活给你一千个伤心的理由...

使用PHP和Node.js连接dubbo短网址服务

使用PHP和Node.js连接dubbo短网址服务

DUBBO是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,是阿里巴巴SOA服务化治理方案的核心框架,每天为2,000+个服务提供3,000,000,000+次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。不巧的...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。