背景
在程序员的职业生涯中,总会遇到数据库表被锁的情况,前些天就又撞见一次。由于业务突发需求,各个部门都在批量操作、导出数据,而数据库又未做读写分离,结果就是:数据库的某张表被锁了!
用户反馈系统部份功能没法使用,紧急排查,定位是数据库表被锁,然落后行紧急处理。这篇文章给大家讲讲遇到类似紧急状态的排查及解决进程,建议点赞收藏,以备不时之需。
故障追踪
用户反馈某功能页面报502毛病,因而第一时间看服务会不会正常,数据库会不会正常。在控制台看到数据库CPU飙升,堆积大量未提交事务,部份事务已阻塞了很长时间,基本定位是数据库层出现问题了。
查看阻塞事务列表,发现其中有锁表现象,本想利用控制台直接结束掉阻塞的事务,但控制台账号权限有限,因而通过客户端登录对应账号将锁表事务kill掉,才避免了情况恶化。
下面就聊聊,如果当突然面对类似的情况,我们该如何紧急响应?
解决方案
想象一个场景,固然也是软件工程师职业生涯中会遇到的一种场景:本来运行正常的程序,某一天突然数据库的表被锁了,业务没法正常运转,那末我们该怎样快速定位是哪一个事务锁了表,如何结束对应的事物?
首先最简单粗鲁的方式就是:重启MySQL。对的,网管解决问题的神器——“重启”。至于后果如何,你能不能跑了,要你自己三思而后行了!
重启是可以解决表被锁的问题的,但针对线上业务很明显不太具有可行性。
下面来看看不用跑路的解决方案:
第一步:查看表使用
遇到数据库阻塞问题,首先要查询一下表会不会在使用。
show open tables where in_use > 0 ;
如果查询结果为空,那末说明表没在使用,说明不是锁表的问题。
mysql> show open tables where in_use > 0 ;
Empty set (0.00 sec)
如果查询结果不为空,比如出现以下结果:
mysql> show open tables where in_use > 0 ;
+———-+——-+——–+————-+
| Database | Table | In_use | Name_locked |
+———-+——-+——–+————-+
| test | t | 1 | 0 |
+———-+——-+——–+————-+
1 row in set (0.00 sec)
则说明表(test)正在被使用,此时需要进一步排查。
第二步:查看进程
查看数据库当前的进程,看看会不会有慢SQL或被阻塞的线程。
履行命令:
show processlist;
该命令只显示当前用户正在运行的线程,固然,如果是root用户是能看到所有的。
在上述实践中,阿里云控制台之所以能够查看到所有的线程,猜想应当使用的就是root用户,而笔者去kill的时候,没法kill掉,是由于登录的用户非root的数据库账号,没法操作另外一个用户的线程。
第三步:查看当前运行的所有事务
如果情况紧急,此步骤可以跳过,主要用来查看核对:
SELECT * FROM information_schema.INNODB_TRX;
第四步:查看当前出现的锁
如果情况紧急,此步骤可以跳过,主要用来查看核对:
SELECT * FROM information_schema.INNODB_LOCKs;
第五步:查询锁等待的对应关系
SELECT * FROM information_schema.INNODB_LOCK_waits;
看事务表INNODB_TRX中会不会有正在锁定的事务线程,看看ID会不会在show processlist的sleep线程中。如果在,说明这个sleep的线程事务一直没有commit或rollback,而是卡住了,需要手动kill掉。
搜索的结果中,如果在事务表发现了很多任务,最好都kill掉。
第六步:kill掉事务
履行kill命令:
kill 1011;
对应的线程都履行完kill命令以后,后续事务即可正常处理。
针对紧急情况,通常也会直接操作第一、第二、第六步。
MySQL的锁
这里再补充一些MySQL锁相关的知识点:数据库锁设计的初衷是处理并提问题,作为多用户同享的资源,当出现并发访问的时候,数据库需要公道地控制资源的访问规则,而锁就是用来实现这些访问规则的重要数据结构。
根据加锁的范围,MySQL里面的锁大致可以分玉成局锁、表级锁和行锁三类。MySQL中表级别的锁有两种:一种是表锁,一种是元数据锁(metadata lock,MDL)。
表锁是在Server层实现的,ALTER TABLE之类的语句会使用表锁,疏忽存储引擎的锁机制。表锁通过lock tables… read/write来实现,而对InnoDB来讲,一般会采取行级锁。毕竟锁住整张表影响范围太大了。
另外一个表级锁是MDL(metadata lock),用于并发情况下保护数据的一致性,保证读写的正确性,不需要显式的使用,在访问一张表时会被自动加上。
MySQL锁表场景
常见的一种锁表场景就是有事务操作处于:Waiting for table metadata lock状态。
Waiting for table metadata lock
MySQL在进行alter table等DDL操作时,有时会出现Waiting for table metadata lock的等待场景。
一旦alter table TableA的操作停滞在Waiting for table metadata lock状态,后续对该表的任何操作(包括读)都没法进行,由于它们也会在Opening tables的阶段进入到Waiting for table metadata lock的锁等待队列。如果核心表出现了锁等待队列,就会造成灾害性的后果。
场景一:长事务运行,阻塞DDL,继而阻塞所有同表的后续操作。
通过show processlist可以看到表上有正在进行的操作(包括读),此时alter table语句没法获得到metadata 独占锁,会进行等待。
场景二:为提交事务,阻塞DDL,继而阻塞所有同表的后续操作。
通过show processlist看不到表上有任何操作,但实际上存在有未提交的事务,可以在information_schema.innodb_trx中查看到。在事务没有完成之前,表上的锁不会释放,alter table一样获得不到metadata的独占锁。
处理方法:通过 select * from information_schema.innodb_trx\G
, 找到未提交事物的sid,然后kill掉,让其回滚。
场景三:显式事务失败操作取得锁,未释放
通过show processlist看不到表上有任何操作,在information_schema.innodb_trx中也没有任何进行中的事务。极可能是由于在一个显式的事务中,对表进行了一个失败的操作(比如查询了一个不存在的字段),这时候事务没有开始,但是失败语句获得到的锁仍然有效,没有释放。从performance_schema.events_statements_current表中可以查到失败的语句。
处理方法:通过performance_schema.events_statements_current找到其sid,kill 掉该session,也能够kill掉DDL所在的session。
总之,alter table的语句是很危险的(核心是未提交事务或长事务致使的),在操作之前要确认对要操作的表没有任何进行中的操作、没有未提交事务、也没有显式事务中的报错语句。
如果有alter table的保护任务,在无人监管的时候运行,最好通过lock_wait_timeout设置好超时时间,避免长时间的metedata锁等待。
小结
关于MySQL的锁表其实还有很多其他场景,我们在实践的进程中尽可能避免锁表情况的产生,固然这需要一定经验的支持。但更重要的是,如果发现锁表我们要能够快速的响应,快速的解决问题,避免影响正常业务,避免情况进一步恶化。所以,本文中的解决思路大家一定要收藏或记忆一下,做到未雨绸缪,避免突然状态下抓瞎。
总结
到此这篇关于MySQL数据库表被锁、解锁和删除事务的文章就介绍到这了,更多相关MySQL表解锁内容请搜索之前的文章或继续浏览下面的相关文章希望大家以后多多支持!
文章来源:丸子建站
文章标题:关于MySQL数据库表被锁、解锁和删除事务详解
https://www.wanzijz.com/view/73353.html