读SQL进阶教程笔记03_自连接

yizhihongxing

读SQL进阶教程笔记03_自连接

1. 针对相同的表进行的连接

1.1. 相同的表的自连接和不同表间的普通连接并没有什么区别,自连接里的“自”这个词也没有太大的意义

1.2. 与多表之间进行的普通连接相比,自连接的性能开销更大

  • 1.2.1. 特别是与非等值连接结合使用的时候

  • 1.2.2. 用于自连接的列推荐使用主键或者在相关列上建立索引

2. 组合

2.1. 有顺序的有序对(ordered pair)

2.2. 无顺序的无序对(unordered pair)

3. 示例

3.1.

读SQL进阶教程笔记03_自连接

3.2. --用于获取可重排列的SQL语句

    SELECT P1.name AS name_1, P2.name AS name_2
      FROM Products P1, Products P2;
  • 3.2.1. 可重排列,所以结果行数9

3.3. --用于获取排列的SQL语句

    SELECT P1.name AS name_1, P2.name AS name_2
      FROM Products P1, Products P2
     WHERE P1.name <> P2.name;
  • 3.3.1. 排除掉由相同元素构成的对,结果行数为排列6

3.4. --用于获取组合的SQL语句

    SELECT P1.name AS name_1, P2.name AS name_2
      FROM Products P1, Products P2
     WHERE P1.name > P2.name;
  • 3.4.1. 只与“字符顺序比自己靠前”的商品进行配对,结果行数为组合3

3.5. --用于获取组合的SQL语句:扩展成3列

    SELECT P1.name AS name_1, P2.name AS name_2, P3.name AS name_3
      FROM Products P1, Products P2, Products P3
     WHERE P1.name > P2.name
      AND P2.name > P3.name;

3.6. ">”和“<”等比较运算符不仅可以用于比较数值大小,也可以用于比较字符串(比如按字典序进行比较)或者日期

4. 删除重复行

4.1. 示例

  • 4.1.1. --用于删除重复行的SQL语句(1):使用极值函数

       DELETE FROM Products P1
        WHERE rowid < ( SELECT MAX(P2.rowid)
                         FROM Products P2
                         WHERE P1.name = P2. name
                           AND P1.price = P2.price ) ;
    
    • 4.1.1.1. Oracle数据库里的rowid
  • 4.1.2. --用于删除重复行的SQL语句(2):使用非等值连接

       DELETE FROM Products P1
        WHERE EXISTS ( SELECT *
                         FROM Products P2
                       WHERE P1.name = P2.name
                         AND P1.price = P2.price
                         AND P1.rowid < P2.rowid );
    

4.2. 如果从物理表的层面来理解SQL语句,抽象度是非常低的

4.3. “表”“视图”这样的名称只反映了不同的存储方法,而存储方法并不会影响到SQL语句的执行和结果

4.4. 无论表还是视图,本质上都是集合——集合是SQL能处理的唯一的数据结构

5. 查找局部不一致的列

5.1. 示例

  • 5.1.1. --用于查找是同一家人但住址却不同的记录的SQL语句

       SELECT DISTINCT A1.name, A1.address
         FROM Addresses A1, Addresses A2
        WHERE A1.family_id = A2.family_id
         AND A1.address <> A2.address ;
    
  • 5.1.2. --用于查找价格相等但商品名称不同的记录的SQL语句

       SELECT DISTINCT P1.name, P1.price
         FROM Products P1, Products P2
        WHERE P1.price = P2.price
         AND P1.name <> P2.name;
    
  • 5.1.3. 如果改用关联子查询,就不需要DISTINCT了

6. 排序

6.1. 示例

  • 6.1.1. --排序:使用窗口函数

       SELECT name, price,
             RANK() OVER (ORDER BY price DESC) AS rank_1,
             DENSE_RANK() OVER (ORDER BY price DESC) AS rank_2
         FROM Products;
    
    • 6.1.1.1. 在出现相同位次后,rank_1跳过了之后的位次,rank_2没有跳过,而是连续排序

    • 6.1.1.2. 依赖于具体数据库来实现的方法

  • 6.1.2. --排序从1开始。如果已出现相同位次,则跳过之后的位次

       SELECT P1.name,
             P1.price,
             (SELECT COUNT(P2.price)
                 FROM Products P2
               WHERE P2.price > P1.price) + 1 AS rank_1
         FROM Products P1
         ORDER BY rank_1;
    
    • 6.1.2.1. 不依赖于具体数据库来实现的方法

    • 6.1.2.2. 去掉标量子查询后边的+1,就可以从0开始给商品排序

    • 6.1.2.3. 如果修改成COUNT(DISTINCT P2.price),那么存在相同位次的记录时,就可以不跳过之后的位次,而是连续输出(相当于DENSE_RANK函数)

7. 同心圆状的递归集合

7.1. 示例

  • 7.1.1.

读SQL进阶教程笔记03_自连接

  • 7.1.2. --排序:使用自连接

       SELECT P1.name,
             MAX(P1.price) AS price,
             COUNT(P2.name) +1 AS rank_1
         FROM Products P1 LEFT OUTER JOIN Products P2
           ON P1.price < P2.price
        GROUP BY P1.name
        ORDER BY rank_1;
    
    • 7.1.2.1. 外连接就是这样一个用于将第1名也存储在结果里的小技巧
  • 7.1.3. --排序:改为内连接

       SELECT P1.name,
             MAX(P1.price) AS price,
             COUNT(P2.name) +1 AS rank_1
         FROM Products P1 INNER JOIN Products P2
           ON P1.price < P2.price
        GROUP BY P1.name
        ORDER BY rank_1;
    
    • 7.1.3.1. 没有比橘子价格更高的水果,所以它被连接条件P1.price < P2.price排除掉了
  • 7.1.4. --不聚合,查看集合的包含关系

       SELECT P1.name, P2.name
         FROM Products P1 LEFT OUTER JOIN Products P2
           ON P1.price < P2.price;
    

原文链接:https://www.cnblogs.com/lying7/p/17270513.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:读SQL进阶教程笔记03_自连接 - Python技术站

(0)
上一篇 2023年4月18日
下一篇 2023年4月18日

相关文章

  • 自动清理MySQL binlog日志

    开启MySQL binlog日志的服务器,如果不设置自动清理日志,默认binlog日志一直保留着,时间一长,服务器磁盘空间被binlog日志占满,导致MySQL数据库出错。 使用下面方法可以安全清理binlog日志 一、没有主从同步的情况下清理日志 mysql -uroot -p123456 -e ‘PURGE MASTER LOGS BEFORE DATE…

    MySQL 2023年4月13日
    00
  • 详解使用navicat连接远程linux mysql数据库出现10061未知故障

    问题描述 当使用Navicat连接远程Linux上的MySQL数据库时,可能会遇到10061未知故障,导致无法连接到数据库。本篇攻略将详细讲解该问题的原因和解决方法。 原因分析 该问题的原因是因为MySQL服务器默认不允许远程访问。为了保证安全性,MySQL只允许本地客户端进行连接访问。因此如果需要远程连接MySQL,需要进行一些额外的配置。 解决方案 步骤…

    MySQL 2023年5月18日
    00
  • windows下本地连接MYSQL数据库,报1130错误的解决方法

    重装MySQL,使用重装之后的密码连接Mysql数据,总报 ERROR 1130: host ‘localhost’ not allowed to connect to this MySQLserver,不能连接数据库,猜测用户权限和密码的问题。 1、用root用户登录mysql数据库 (1)停止MySQL服务,执行net stop mysql; (2)在m…

    MySQL 2023年4月13日
    00
  • MySQL thread_stack连接线程的优化

    MySQL 的 thread_stack 参数用于配置连接线程的最大栈空间大小,是一个影响 MySQL 运行性能的重要参数。在高并发、大数据量场景下,可通过调整该参数来优化 MySQL 的连接线程,提升系统的性能和稳定性。 下面是一个完整的 MySQL thread_stack 连接线程优化攻略,包括调整步骤和示例说明。 步骤一:查看默认 thread_st…

    MySQL 2023年5月19日
    00
  • 缓存与数据库双写一致性几种策略分析

    作者:京东零售 于泷 一、背景 在高并发场景中,为防止大量请求直接访问数据库,缓解数据库压力,常用的方式一般会增加缓存层起到缓冲作用,减少数据库压力。引入缓存,就会涉及到缓存与数据库中数据如何保持一致性问题,本文将对几种缓存与数据库保证数据一致性的使用方式进行分析。为保证高并发性能,以下分析场景不考虑执行的原子性及加锁等强一致性要求的场景,仅追求最终一致性。…

    MySQL 2023年4月19日
    00
  • MySQL选错索引的原因以及解决方案

    下面是详细的攻略: MySQL选错索引的原因 选错索引在MySQL中是一个常见的问题,通常会导致查询性能下降甚至出现全表扫描的情况。下面是一些可能导致选错索引的原因: 非常规查询模式:当查询表的方式不是传统方式,如在WHERE语句中使用函数或表达式时,可能会导致MySQL无法使用最优索引,从而选择了错误的索引。 不同的查询条件:在不同的查询条件下,选择不同的…

    MySQL 2023年5月18日
    00
  • mysql如何优化插入记录速度

    当我们需要快速插入大量数据时,如何优化MySQL插入记录的速度是一个常见的问题。以下是一些可能有帮助的优化策略: 批量插入 单个插入操作可能会使磁盘高速缓存失效,导致插入速度变慢。批量插入可以减少这种情况的发生,并提高插入速度。 示例: INSERT INTO table_name (column1, column2) VALUES (value1, val…

    MySQL 2023年5月19日
    00
  • MySQL配置文件my.cnf参数优化和中文详解

    关于MySQL配置文件my.cnf参数优化和中文详解的攻略,我可以给您提供详细的内容。 1. 什么是MySQL配置文件my.cnf MySQL配置文件my.cnf是MySQL的主要配置文件,通常位于MySQL的安装根目录或者/etc目录下。通过修改my.cnf配置文件中的参数值,可以调整MySQL的性能,使其满足不同的需求。 2. 如何优化MySQL配置文件…

    MySQL 2023年5月19日
    00
合作推广
合作推广
分享本页
返回顶部