网络知识 娱乐 搞定面试官 - 可以讲一下你平时是如何进行 SQL 性能分析的嘛?

搞定面试官 - 可以讲一下你平时是如何进行 SQL 性能分析的嘛?

SQL 性能分析

大家好,我是程序员啊粥,这段时间一直在分享 MySQL 索引系列的文章,我们学会了B+ 树索引模型,以及索引长度的计算、明明使用 Delete 把数据删除了,但是为什么磁盘上的数据文件大小没变?等内容,今天开始我们学习 SQL 的优化。

说起 SQL 优化,我们需要知道一个 SQL 的执行频率,假如说你有一条慢 SQL,好几个月才执行一次,那我觉得你其实也没啥花费精力优化它的必要,毕竟执行频率太低,投入产出比不足。

SQL 执行频率

关于查询 SQL 执行频率,我们可以使用 show global status like 'Com___',(这后边是 7 个下划线),这条命令可以显示当前数据库中增删改查等各个语句的使用次数,可以看我,我这个库中,大量的执行语句都是 select 语句,其他语句非常少。

那说明这个库中的查询时比较多的,所以我们需要额外关注查询的效率。

file

关于具体的查询效率,我们可以通过查询数据库的慢 SQL 日志来查询。

慢查询日志

  • 慢查询日志是否开启:show variables like 'slow_query_log'
  • 开启慢日志:set global slow_query_log = 1; (只对当前会话生效,全局生效需要修改 my.conf 配置文件)
  • 设置慢查询阈值:set global long_query_time = 4
  • 之后就可以在 slow.log 文件中查询到执行的慢 SQL。

这部分基本掌握这几个命令就可以了,我们可以在临时会话中开启慢 SQL 日志,然后执行对应的 SQL 语句来记录日志。

慢查询日志可以帮我们记录具体的慢查询语句,但是为什么慢它是没发告诉我们的,因此,我们还需要借助其他的一些命令来帮助我们具体慢的原因。

使用 MySQL profiling 功能剖析单条查询

  • show profiles 能在做 SQL 优化时帮助我们了解耗时具体耗在了哪里。

  • show prifile for query id 查看具体各个阶段的耗时

file

这两条命令结合在一起,可以明确告诉我们这条 SQL 在执行中,到底耗时在那一步,比如是某个子查询或者 Server 层数据传输等具体原因。

得出时间消耗在那个环节之后,我们便可以使用具体的执行计划来进行针对性的优化,下边着重介绍一下关于 SQL 执行计划的使用。

explain 执行计划

结果输出展示:

file

id

该语句的唯一标识。如果 explain 的结果包括多个 id 值,则数字越大越先执行;而对于相同 id 的行,则表示从上往下依次执行。

select_type

查询类型,有如下几种取值:

file

table

表示当前这一行正在访问哪张表,如果 SQL 定义了别名,则展示表的别名

partitions

当前查询匹配记录的分区。对于未分区的表,返回 null

type

连接类型,有如下几种取值,性能从好到坏排序 如下:

  • system:该表只有一行(相当于系统表),system是const类型的特例

  • const:针对主键或唯一索引的等值查询扫描, 最多只返回一行数据. const 查询速度非常快, 因为它仅仅读取一次即可

  • eq_ref:当使用了索引的全部组成部分,并且索引是 PRIMARY KEY 或 UNIQUE NOT NULL 才会使用该类型,性能仅次于 system 及 const。

  • ref:当满足索引的最左前缀规则,或者索引不是主键也不是唯一索引时才会发生。如果使用的索引只会匹配到少量的行,性能也是不错的。

  • fulltext:全文索引

  • ref_or_null:该类型类似于 ref,但是 MySQL 会额外搜索哪些行包含了 NULL。这种类型常见于解析子查询

  • index_merge:此类型表示使用了索引合并优化,表示一个查询里面用到了多个索引

  • unique_subquery:该类型和 eq_ref 类似,但是使用了 IN 查询,且子查询是主键或者唯一索引。

  • index_subquery:和 unique_subquery 类似,只是子查询使用的是非唯一索引

  • range:范围扫描,表示检索了指定范围的行,主要用于有限制的索引扫描。比较常见的范围扫描是带有 BETWEEN 子句或 WHERE子 句里有 >、>=、<、<=、IS NULL、、BETWEEN、LIKE、IN()等操作符。

  • index:全索引扫描,和 ALL 类似,只不过 index 是全盘扫描了索引的数据。当查询仅使用索引中的一部分列时,可使用此类型。有两种场景会触发:

    • 如果索引是查询的覆盖索引,并且索引查询的数据就可以满足查询中所需的所有数据,则只扫描索引树。此时,explain 的Extra 列的结果是 Using index。index 通常比 ALL 快,因为索引的大小通常小于表数据。
    • 按索引的顺序来查找数据行,执行了全表扫描。此时,explain 的Extra 列的结果不会出现 Uses index。
  • ALL:全表扫描,性能最差。

possible_keys

展示当前查询可以使用哪些索引,这一列的数据是在优化过程的早期创建的,因此有些索引可能对于后续优化过程是没用的。

key

表示 MySQL 实际选择的索引

key_len

索引使用的字节数。由于存储格式,当字段允许为 NULL 时,key_len 比不允许为空时大 1 字节。

ref

表示将哪个字段或常量和 key 列所使用的字段进行比较。

如果 ref 是一个函数,则使用的值是函数的结果。要想查看是哪个函数,可在 EXPLAIN 语句之后紧跟一个 SHOW WARNING 语句。

rows

MySQL 估算会扫描的行数,数值越小越好。

filtered

表示符合查询条件的数据百分比,最大 100。用 rows × filtered 可获得和下一张表连接的行数。例如rows = 1000,filtered = 50%,则和下一张表连接的行数是 500。

以上就是关于 explain 执行计划结果中的字段说明,具体的含义很多都是我从官网直接拿过来的,比较枯燥,当然也不需要你死记硬背,只要你在 SQL 优化过程中,有意识的使用 explain 分析它的执行计划,然后来查阅一下每个字段是什么含义,最后针对具体的问题进行能进行优化,这就可以了。

关于 explain 的具体使用,我会在下一篇文章中进行实战演练,今天就单纯介绍一下这些字段的含义,你有个大概印象就可以。

我是程序员啊粥,关注我,我们一起在技术海洋中向上生长。