MySQL中多个left join on关联条件的顺序说明

MySQL
271
0
0
2023-06-18
标签   MySQL语句
目录
  • MySQL多个left join on关联条件顺序
  • 结论
  • 案例
  • SQL数据
  • 使用left join的on后查询碰到的大坑
  • 使用 WHERE
  • 使用 LEFT JOIN ...... ON  ......
  • 原因 

MySQL多个left join on关联条件顺序

注意:下面的案例特别重要!请重视!SQL有点长,但确实是干货!

结论

如果存在多个left join on,请注意on后面的条件与哪个表关联。这一条统计的SQL很重要!例如表A,B,C,A left join B on A.x = B.x left join C on A.x = C.x,B和C的都要和A建立关联,B和C之间是没有任何数据上的关系。

但是 如果把A.x = C.x改成B.x = C.x,那么B和C的表数据先建立关联并过滤数据,再与A表数据进行关联,这样可能会出现数据丢失!

案例

有一张分数表,表字段有日期、姓名、语文得分和数学得分等,请统计每个日期中,语文最高得分的姓名和分数,数学最低得分的姓名和分数。

思路:过滤出所有日期 left join 筛选语文 on … left join 数学得分 on …

正确的SQL:

SELECT
	* 
FROM
	( SELECT report_date reportDate FROM tb_more_left_join mlj GROUP BY mlj.report_date ) mix
	LEFT JOIN (
SELECT
	mlj.report_date maxReportDate,
	GROUP_CONCAT( mlj.user_name ) maxUserNames,
	a.maxScore 
FROM
	tb_more_left_join mlj
	LEFT JOIN ( SELECT report_date, MAX( chinese_score ) maxScore FROM tb_more_left_join mlj GROUP BY mlj.report_date ORDER BY NULL ) a ON mlj.report_date = a.report_date 
WHERE
	mlj.chinese_score = a.maxScore 
GROUP BY
	mlj.report_date 
	) mx ON mix.reportDate = mx.maxReportDate
	LEFT JOIN (
SELECT
	mlj.report_date minReportDate,
	GROUP_CONCAT( mlj.user_name ) minUserNames,
	a.minScore 
FROM
	tb_more_left_join mlj
	LEFT JOIN ( SELECT report_date, MIN( math_score ) minScore FROM tb_more_left_join mlj GROUP BY mlj.report_date ORDER BY NULL ) a ON mlj.report_date = a.report_date 
WHERE
	mlj.math_score = a.minScore 
GROUP BY
	mlj.report_date 
	) mn ON mix.reportDate = mn.minReportDate

正确结果:

错误的SQL:

把正确SQL中最后一个on条件改为mx.maxReportDate = mn.minReportDate,注意,是把mix.reportDate改为了mx.maxReportDate。

错误结果:

错误原因:

  • 查询语文最高成绩时,没有查到2019-12-01的数据
  • 查询数学最低成绩时,使用on与语文最高成绩关联,因为没有查到语文最高成绩的日期,所以两个表关联时,数学最低成绩即使有数据,也会因为语文最高成绩无数据而被忽略。

SQL数据

CREATE TABLE `tb_more_left_join`  (
  `id` int() NOT NULL,
  `report_date` date NULL DEFAULT NULL,
  `user_name` varchar() CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `math_score` int() NULL DEFAULT NULL,
  `chinese_score` int() NULL DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

INSERT INTO `tb_more_left_join` VALUES (, '2019-12-01', '盲僧', 70, NULL);
INSERT INTO `tb_more_left_join` VALUES (, '2019-12-01', '薇恩', 100, NULL);
INSERT INTO `tb_more_left_join` VALUES (, '2019-12-02', '赵信', 30, 60);
INSERT INTO `tb_more_left_join` VALUES (, '2019-12-02', '琴女', NULL, 100);
INSERT INTO `tb_more_left_join` VALUES (, '2019-12-03', '蛮王', 50, 100);
INSERT INTO `tb_more_left_join` VALUES (, '2019-12-03', '艾希', 100, 100);
INSERT INTO `tb_more_left_join` VALUES (, '2019-12-03', '亚索', 60, 90);

使用left join的on后查询碰到的大坑

很多时候我们在使用  LEFT JOIN  ...... ON .... 时, 除了连接两个表的字段条件外,我们往往还需要一些等值或者范围 等等类似的数据筛选条件。

那么对于初学者,往往会犯一个错误,就是 想当然 地 认为, ON 后面的条件是逐一执行的,因为没有了解清楚 ON 后面接条件的规则。

是个什么样的场景? 

看实例讲解:

userinfo 表 :

(找兼职的人员名单信息表)

jobinfo表 :

(兼职工作信息及职业要求表)

业务需求:

根据职业要求 给 找兼职的人员 匹配上 目前 可以做的兼职,输出数据条。 

例如,李三是一个程序员,他迫于经济压力,不得不向社会低头,想找一些自己能做的兼职。

使用 WHERE

如果我们不用 left join ...... on ... , 仅仅使用 where,那么简单写下sql是:

SELECT * 
FROM userinfo AS u ,jobinfo AS j 
WHERE u.userProfession=j.professionRequire
AND j.professionRequire='程序员'

查询出来的结果如下:

是我们需要的结果,可以看的,程序员李三能做的兼职有,送外卖或者当保安。 

使用 LEFT JOIN ...... ON  ......

初学者(罪过)写的SQL :

想当然地把筛选条件 职业要求为 ‘ 程序员’ 直接 拼接在 ON 后面

SELECT * 
FROM userinfo AS u 
LEFT JOIN   
jobinfo AS j 
ON u.userProfession=j.professionRequire
AND j.professionRequire='程序员'

这样地拼接筛选条件其实是达不到所想要的效果的,先来看看这样的执行结果:

可以看到查询出来很多我们不想要的数据,为什么会这样?

原因 

因为如果直接把关联表的筛选条件拼接在 ON 后, 执行的顺序其实是:

将 jobinfo 表 按照筛选条件  professionRequire='程序员' 执行后作为子查询,再执行 LEFT JOIN ...... ON 。

也就是第一步变成了执行  SELECT * FROM jobinfo AS j WHERE j.professionRequire='程序员'  

然后再进行连接查询,也就是 

整个sql语句其实变成了:

SELECT * 
FROM userinfo AS u 
LEFT JOIN   
(SELECT *  FROM jobinfo  WHERE jobinfo.professionRequire='程序员') AS j 
ON 
u.userProfession=j.professionRequire

这样查询出来,显然不是我们想要的结果。

那么我们在使用 LEFT JOIN ...... ON  ...... 拼接筛选条件时,我们应该怎么做?

配合 WHERE 使用:

SELECT * 
FROM userinfo AS u 
LEFT JOIN   jobinfo AS j 
ON u.userProfession=j.professionRequire
WHERE j.professionRequire='程序员'

结果:

我们把筛选条件配合where去使用, 执行的逻辑就是:

先执行LEFT JOIN ...... ON  ......  先将关联两个表之后的数据查询出来;

再按照 professionRequire='程序员'  条件,进行数据筛选。

所以这是我们想要得到的结果。

这是一个使用 LEFT JOIN 的 ON 初学者很容易犯的错误,大家稍微注意点。