10年+SQL性能优化专家谈SQL等价改写核心思想

墨墨导读:2020数据技术嘉年华于11月21日落下帷幕,大会历时两天,来自全国各地的数据领域学术精英、领袖人物、技术专家、从业者和技术爱好者相聚北京,见证了个人的快速成长、技术的迭代进步、行业的蓬勃发展、生态的融合共赢,以及市场的风云变迁。

2020数据技术嘉年华近50个PPT下载、视频回放已上传墨天轮平台,可在“数据和云”公众号回复关键词“DTC2020”获得!

本文根据 罗炳森 老师在 2020数据技术嘉年华 分享的主题《SQL等价改写核心思想》整理而成。
罗炳森:云和恩墨数据库架构师,10年+专职性能优化&SQL优化经验,5年SQL优化培训经验,累计为中国培养了2000多位DBA,1000多位ETL/BI/大数据开发人才。
SQL优化可不仅仅是:收集一下统计信息,创建一些索引,添加一些HINT,绑定一下执行计划。SQL优化还需要能够对SQL进行等价改写,SQL等价改写往往是SQL优化所有环节中最难的,不管数据库是Oracle,SQL SERVER,DB2,还是MySQL,PostGre SQL,Oceanbase,Hadoop Hive等,都离不开SQL等价改写。对于某些SQL,往往只有进行等价改写才能彻底优化。
本文主要议题:
本文分5部分,循序渐进为大家讲解SQL等价改写的核心思想及其方法和技巧。首先我们来学习数据库中表与表之间的关系:
对表与表之间关系有个大概印象之后,我们来看一个表与表之间是1:1关系的优化案例:
只需要对SQL代码稍做改动,SQL性能立马提升200多倍。如果不对SQL进行等价改写,想要优化这个SQL是不可能的。当然了你可能会说,我可以在业务上将a和b合并,这样不也达到了优化目的了吗?是的,这样是可以优化,但是这并不属于SQL层面的优化,而是业务重构,数据模型层面的优化了,本文的主题是SQL等价改写,而非数据模型层面。
现在我们来学习什么是半连接:
了解了半连接的概念之后,下面用两种方法将半连接改写为内连接:
半连接也可以改写为标量子查询(后面还会介绍什么是标量子查询):
更神奇的是半连接还可以改写为反连接:
了解了半连接改写技巧之后,我们来看一个经典的半连接等价改写优化案例吧:
通过这个案例我们回顾了半连接的改写技巧,同时也加深了对SQL等价改写的认知。
下面我们来学习什么是反连接:
反连接等价改写一般只有两种方法(不像半连接等价改写方式很多):
掌握了半连接,反连接等价改写之后,现在我们来学习标量子查询:
我们来学习标量子查询改写方法:
并不是所有的标量子查询都能改写为外连接:
标量子查询非等值关联改写要对主表访问2次:
现在我们来看一个比较难的标量子查询改写案例吧:
这个案例包含了半连接改写为内连接的知识,标量子查询改写为外连接的知识,以及标量子查询中没有聚合函数它属于1的关系的知识,可以这样说,如果你吃透了这个案例,那么你已经具备了一定的SQL等价改写能力了。
并不是所有的标量子查询都要被改写为外连接,有时候反而要将外连接改写为标量子查询。
现在,我们来看一个将外连接改写为标量子查询的案例吧:
掌握了标量子查询改写技巧之后,我们来学习本文最后一个知识点Filter:
网上有很多in,exists谁快谁慢的谬论,写这些文章的很多人是连SQL优化都没入门的,所以大家别去相信那些谬论。
简单的Filter改写:
复杂的Filter改写:
最后,我们来总结一下SQL等价改写:
(0)

相关推荐

  • 业务流程优化设计的思想和原则

    引言 谈到ERP理论的核心思想,大致都离不开"企业流程优化和再造".但到底什么是"企业流程优化(再造)",又应依据什么来对企业进行"流程优化" ...

  • Flink SQL 性能优化:multiple input 详解

    简介: 在 Flink 1.12 中,针对目前 operator chaining 无法覆盖的场景,推出了 multiple input operator 与 source chaining 优化.该 ...

  • 专家谈“智慧课堂”:核心是促进深度学习

    智慧课堂核心是促进深度学习 编者按 智慧课堂应是信息技术与教学的深度融合.然而,目前一些课堂看似高技术,实际是披上信息化外衣的传统教学,甚至出现教师课堂花样"炫技"现象.如何用活. ...

  • MySQL语句性能优化之Sql错误用法

    本文主要总结了慢查询优化的过程中常用的以及不合理的操作,适合所有的运维及开发人员. 1.LIMIT 语句 分页查询是最常用的场景之一,但也通常也是最容易出问题的地方.比如对于下面简单的语句,一般 DB ...

  • 52 条 SQL 语句性能优化策略,建议收藏

    作者:https://www.cnblogs.com/SimpleWu/ 1, 对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2,应尽量避免 ...

  • 52条SQL语句性能优化策略,建议收藏

    来源:cnblogs.com/SimpleWu/p/9929043.html 本文会提到 52 条 SQL 语句性能优化策略. 1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 WHERE 及 O ...

  • 52 条 SQL 语句性能优化策略

    52 条 SQL 语句性能优化策略,建议收藏! 开发者全社区 5天前 作者:SimpleWu 来源:www.cnblogs.com/SimpleWu/p/9929043.html 本文会提到52条SQ ...

  • 性能优化:核心库CPU使用率100%,SQL优化后执行效率提升10000多倍

    墨墨导读:某客户一系统早上业务高峰时段RAC数据库两节点CPU使用率接近100%,导致业务响应缓慢,通过分析原因定位SQL完成优化改写后降低CPU的使用率,业务恢复正常. 问题现象 客户一系统在202 ...

  • 涨姿势的52条SQL语句性能优化

    转自:cnblogs.com/SimpleWu/p/9929043.html 本文会提到 52 条 SQL 语句性能优化策略. 1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 WHERE 及 O ...

  • SQL Server优化技巧——如何避免查询条件OR引起的性能问题

    之前写过一篇博客"SQL SERVER中关于OR会导致索引扫描或全表扫描的浅析",里面介绍了OR可能会引起全表扫描或索引扫描的各种案例,以及如何优化查询条件中含有OR的SQL语句的 ...