如何进行MySQL源码调试(一条select语句的执行流程)

yizhihongxing

一、背景

MySQL是当今世上最受欢迎的使用最广泛的开源数据库,它的繁荣离不开它的开源特性。放在过去商业数据库的时代,大家都没有机会接触到数据库的源代码,但在如今开源数据库的时代,越来越多的人开始研究数据库的源码,并给社区贡献代码,MySQL官方每次发布新版本都要感谢一些在社区上贡献代码的程序员。现在新的数据库时代也给DBA提出了更高的要求,学会调试源码,通过源码定位问题,这是DBA进阶的方向。MySQL的源码有几百上千万行,想全部搞懂几乎是不可能的,研究源码一般推荐从某个功能点入手。而学会调试源码,不管对研究源码或通过源码定位问题,都是必备的技能。本文将介绍Linux平台下如何通过gdb进行MySQL源码调试,并简单介绍通过调试源码定位一条select语句的执行流程。

二、源码调试方法

关于源码的编译及调试,不同的平台可以通过不同的工具来进行:windows平台下可以通过visual studio来进行,https://www.cnblogs.com/huangxincheng/p/13084736.html 按照这篇文章的方法可以进行5.7的调试,通过cmake生成mysql.sln文件,然后给打开sln文件编译成功后,就可以进入调试模式了。在某个函数处打下断点,F5进入调试模式后,就可以对数据库进行操作了,命中断点后就可以查看堆栈的函数调用关系。一般在实际应用中,MySQL都是运行在Linux平台下,在Linux平台下一般是通过GDB(GNU symbolic debugger)工具进行调试,C/C++ 项目的开发和调试包括故障排查都是利用 GDB 完成的。此外,VsCODE这种IDE工具可以在本地的windows操作系统下,通过ssh远程调试Linux平台下的MySQL,https://mp.weixin.qq.com/s/RO_Ipa9_SH8_DuVholrgvg,姜老师这篇文章也简单讲了一下如何操作。

三、GDB调试MySQL源码

3.1 MySQL源码下载

首先需要在MySQL官网上下载MySQL源码,操作系统选择为source code,OS版本选择为ALL OPERATING SYSTEM,下载带boost头文件的源码包。如果对MySQL的版本没有特别要求的话,一般推荐下载最新版本的,因为老版本中存在bug的概率较大,编译过程需要解决这些bug,比如在8.0.23版本中编译过程中报了这个错:buf0buf.cc:1227:44: error: ‘SYS_gettid’ was not declared in this scope。参考MySQL官方论坛:https://forums.mysql.com/read.php?117,674410,676378#msg-676378,在storage/innobase/buf/buf0flu.cc文件代码中加上声明#include <sys/syscall.h>,解决了这个报错。

3.2 编译安装环境准备

源码编译需要gcc等基础软件支持,MySQL8.0版本 gcc至少需要7.1以上,一般推荐直接升级到最高版本,在线环境比较好办直接通过yum安装即可。离线环境的下载及安装可以参考这两篇文章分别升级gcc和cmake:

https://mp.weixin.qq.com/s/kWPD1o5fWTAxUNETGsXA7ghttps://mp.weixin.qq.com/s/5sHPJ0Kxkmj2llW-UvEbkg把gcc和cmake搞定后,就可以开始编译安装mysql了。

3.3 编译和安装MySQL

参考官方文档通过源码安装mysql这一章可以完成mysql的编译和安装:

如何进行MySQL源码调试(一条select语句的执行流程)

实际cmake加上这几个参数,其中-DWITH_DEBUG=1是为了开启调试模式。

cmake .. -DCMAKE_INSTALL_PREFIX=/usr/local/mysql -DWITH_BOOST=/root/gdb_mysql/mysql-8.0.23/boost/boost_1_73_0 -DWITH_DEBUG=1

接着make install成功后,配置好配置文件/etc/my.cnf,就可以初始化数据库并启动数据库了。

mysqld --initialize --user=mysql
mysqld_safe --user=mysql &

启动完数据库后,登录数据库可以发现现在已经是debug模式了。

如何进行MySQL源码调试(一条select语句的执行流程)

3.4 gdb调试源码

完成MySQLdebug版本的安装和启动后,gdb命令下attach mysql的进程号,就可以对mysql进程进行打断点调试了。

如何进行MySQL源码调试(一条select语句的执行流程)

 gdb调试过程中常用的命令可以参考如下:

attach 进程号 #进入调试模式
b Sql_cmd_insert::mysql_insert  #在某个函数打下断点
b filename:linenum  #在文件的某行打下断点    
clear function  #在某个函数处删除断点
bt   #查看堆栈信息
n    #next 单步调试,每次只执行往下一行代码,对于调用的函数来说,next 命令只会将其视作一行代码。 #n 3 往下执行三行代码 
s    #step 单步调试,当 step 命令所执行的代码行中包含函数时,会进入该函数内部,并在函数第一行代码处停止执行。
c    #continue 当程序在某一断点处停止运行后,使用该指令可以继续执行,直至遇到下一个断点或者程序结束。
l    #list 显示源程序代码的内容,包括各行代码所在的行号。
p xxx  #print 打印指定xxx变量的值
info breakpoint   #查看断点信息

 

四、一条select语句的调试

在handle_connection函数处打下断点,然后在mysql客户端执行一条select语句,可以在gdb里面看到,程序很快命中了断点,接下来便可以通过单步调试,一步一步定位select语句的执行流程。

#客户端连接的线程处理函数
handle_connection (arg=0xb998240) at /gdb/mysql-8.0.23/sql/conn_handler/connection_handler_per_thread.cc
#读取连接发来的命令,然后执行
do_command (thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1320
#THD类,描述每个客户端连接产生的后台进程
#发出命令
dispatch_command (thd=0x7f5a3815d3c0, com_data=0x7f5afc7adb00, command=COM_QUERY)
#根据command=COM_QUERY,调用alloc_query函数(读取查询语句并存在thd->query中)
if (alloc_query(thd, com_data->com_query.query,com_data->com_query.length))
#执行到dispatch_sql_command(thd, &parser_state); 解析sql语句,然后把结果发给executor
dispatch_sql_command(thd, &parser_state);
#进入dispatch_sql_command函数,执行到mysql_execute_command函数(Execute command saved in thd and lex->sql_command)
error = mysql_execute_command(thd, true);

#在mysql_execute_command函数中,执行到case SQLCOM_SELECT,res = lex->m_sql_cmd->execute(thd),进入到execute函数
#在mysql_execute_command函数中,switch (lex->sql_command)通过case SQLCOM_XXX,转到不同语句的执行器
#这时候就进入到了lex的公共属性m_sql_cmd类下面的execute函数;
#通过单步调试,此时程序进入到了Sql_cmd_dml::execute (this=0x7f5a38bee0b0, thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_select.cc:517

#此时可以看到,解析SQL是在dispatch_sql_command和mysql_execute_command函数中完成的,Sql_cmd_dml::execute的函数主要有6步
Prelocking;Preparation;Locking of tables;Optimization;Execution or explain;Cleanup
#lock_tables(thd, lex->query_tables, lex->table_count, 0) 锁表
#execute_inner(thd) 执行

#进入execute阶段
Sql_cmd_dml::execute_inner (this=0x7f1ca0011858, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_select.cc:809
if (unit->optimize(thd, /*materialize_destination=*/nullptr, /*create_iterators=*/true)) #优化
if (unit->execute(thd)) return true; #执行
#此时执行到了SELECT_LEX_UNIT::execute (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1267
return ExecuteIteratorQuery(thd);
#执行ExecuteIteratorQuery这个函数
SELECT_LEX_UNIT::ExecuteIteratorQuery (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1125
#执行完成后返回查询语句的结果值 return query_result->send_eof(thd);
#这个时候Sql_cmd_dml::execute_inner函数也执行完成了,进而Sql_cmd_dml::execute,mysql_execute_command也接着执行完成

#执行到dispatch_command函数的thd->send_statement_status(); 这一行,看到客户端执行的查询语句也输出了结果
#执行到handle_connection的while (thd_connection_alive(thd)) {if (do_command(thd)) break;}; 意味着mysql连接结束了,这时候调试也随之结束。

select语句的执行流程可以总结如下,这些函数可以方便以后打断点,更快的定位问题:

1. 客户端连接线程处理函数
handle_connection (arg=0xb998240) at /gdb/mysql-8.0.23/sql/conn_handler/connection_handler_per_thread.cc:301
2. 读取连接发来的命令,然后执行
do_command (thd=0x7f5a3815d3c0) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1320
3. 发出命令,并将查询语句存在thd->query中
dispatch_command (thd=0x7f1ca0011100, com_data=0x7f1d644d3b00, command=COM_QUERY) at /gdb/mysql-8.0.23/sql/sql_parse.cc:1836
4. 解析sql语句,然后把结果发给executor
dispatch_sql_command (thd=0x7f1ca0011100, parser_state=0x7f1d644d2a60) at /gdb/mysql-8.0.23/sql/sql_parse.cc:4988
5. 执行存在thd中的语句
mysql_execute_command (thd=0x7f1ca0011100, first_level=true) at /gdb/mysql-8.0.23/sql/sql_parse.cc:4407
6. SELECT语句的:准备,锁表,优化,执行
Sql_cmd_dml::execute (this=0x7f1ca09feb28, thd=0x7f1ca0011100) at /gdb/mysql-8.0.23/sql/sql_select.cc:612
7. SELECT语句的优化和执行
Sql_cmd_dml::execute_inner (this=0x7f1ca0011858, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_select.cc:809
8. SELECT语句的执行
SELECT_LEX_UNIT::execute (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1267
9. 执行语句,返回结果
SELECT_LEX_UNIT::ExecuteIteratorQuery (this=0x7f1ca0023e48, thd=0x7f1ca0005ed0) at /gdb/mysql-8.0.23/sql/sql_union.cc:1125

五、总结

不管是研究MySQL源码还是通过源码定位问题,学会调试MySQL源码都是必备的基础技能,MySQL源码体系十分庞大,调试源码可以更快更清晰从源码中定位问题。

原文链接:https://www.cnblogs.com/coygfly/p/17379482.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何进行MySQL源码调试(一条select语句的执行流程) - Python技术站

(0)
上一篇 2023年5月10日
下一篇 2023年5月11日

相关文章

  • MySQL存储函数详解

    MySQL存储函数是存储在MySQL数据库中的一段代码,用于执行特定的任务并返回结果。 它们可以接受一个或多个参数,可以返回一个或多个值。 MySQL存储函数具有以下优点: 增加了代码重用性; 提高了代码的模块化和可维护性; 提高了查询性能。 下面是一个MySQL存储函数的例子: DELIMITER // CREATE FUNCTION getAverage…

    MySQL 2023年3月10日
    00
  • MySQL学习笔记-索引

    索引 索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。 无索引的查找:全表扫描(将整张表遍历一遍),性能极低。 有索引的查找:数据库系统在存储数据的同时会维护一种数据结构(如二叉…

    MySQL 2023年4月17日
    00
  • Mysql optimize table 时报错:Temporary file write fail的解决

    当我们在对Mysql的表进行优化时,有时候会遇到”Temporary file write fail”的报错信息,这是由于mysql在进行优化操作时需要写入一些临时文件,而操作时出现了无法写入临时文件的情况引起的。 下面是解决这个问题的完整攻略: 1. 确认磁盘空间是否足够 首先需要确认一下磁盘空间是否足够,可以通过运行df命令查看磁盘使用情况,如下所示: …

    MySQL 2023年5月18日
    00
  • MySQL禁用InnoDB引擎的方法

    MySQL是一种关系型数据库,它支持多种存储引擎,包括MyISAM、InnoDB等。有时候,我们需要禁用MySQL某些存储引擎,比如InnoDB。下面详细讲解“MySQL禁用InnoDB引擎的方法”的完整攻略。 步骤一:查看当前默认的存储引擎 在禁用InnoDB存储引擎之前,我们首先需要查看当前的默认存储引擎。可以通过执行以下SQL语句来查看: SHOW E…

    MySQL 2023年5月19日
    00
  • 水平分库分表排雷帖

    一、背景 提起分库分表,对于大部分服务器开发来说,其实并不是一个新鲜的名词。随着业务的发展,我们表中的数据量会变的越来越大,字段也可能随着业务复杂度的升高而逐渐增多,我们为了解决单表的查询性能问题,一般会进行分表操作。 同时我们业务的用户活跃度也会越来越高,并发量级不断加大,那么可能会达到单个数据库的处理能力上限。此时我们为了解决数据库的处理性能瓶颈,一般会…

    MySQL 2023年5月6日
    00
  • MySQL闪回(flashback)原理与实战

    MySQL闪回(flashback)原理与实战 MySQL闪回(Flashback)是指在不使用外部备份文件的情况下,将MySQL数据库恢复到之前某个时间点的状态。闪回可以用于撤销对数据库误操作或临时重建数据库,避免数据库因为外部因素的破坏而无法使用。下面将详细讲解MySQL闪回的原理和实战步骤。 原理解析 MySQL闪回的实现原理是将当前的数据表重命名,然…

    MySQL 2023年5月18日
    00
  • MySQL中表锁和行锁机制浅析(源码篇)

    MySQL中表锁和行锁机制浅析(源码篇)详解 引言 MySQL在多个并发事务操作下,采用锁机制保证数据的一致性和并发量。MySQL锁机制主要分为表锁和行锁。本文将分析MySQL中表锁和行锁机制的源码实现原理及其应用。 表锁 概念 表锁的应用范围为整张表,在操作时会锁定整张表,其他事务将无法读写该表。 应用场景 表锁适用于以下场景: 对整张表进行DDL操作(如…

    MySQL 2023年5月19日
    00
  • mysql 查询重复的数据的SQL优化方案

    当我们需要查询数据库中重复的数据时,在传统的方法中,我们可以使用GROUP BY函数或者DISTINCT函数进行实现,但是这种方式的缺点在于运行效率低下,特别是对于大数据量的查询。因此,我们需要一些更加高效的SQL优化方案。 下面是mysql查询重复数据的SQL优化方案的完整攻略: 1. 通过使用HAVING子句和COUNT函数来查询 第一种方法是使用HAV…

    MySQL 2023年5月19日
    00
合作推广
合作推广
分享本页
返回顶部