如何解决MySQL:过滤子记录,包括所有兄弟姐妹
有两个 MySQL 表:
tparent(id int,some data...)
tchild(id int,parent_id int,some data...)
我需要返回所有列(父项加上所有子项),其中至少有一个子项符合某些条件。
我目前的解决方案:
-- prepare sample data
DROP TABLE IF EXISTS tparent;
DROP TABLE IF EXISTS tchild;
CREATE TABLE tparent (id int,c1 varchar(10),c2 date,c3 float);
CREATE TABLE tchild(id int,c4 float,c5 varchar(20),c6 date);
CREATE UNIQUE INDEX tparent_id_IDX USING BTREE ON tparent (id);
CREATE UNIQUE INDEX tchild_id_IDX USING BTREE ON tchild (id);
INSERT INTO tparent
VALUES
(1,'a','2021-01-01',1.23),(2,'b','2021-02-01',1.32),(3,'c','2021-01-03',2.31);
INSERT INTO tchild
VALUES
(10,1,22.333,'argh1','2000-01-01'),(20,33.222,'argh2','2000-01-02'),(30,44.555,'argh3','2000-02-02'),(40,2,'argh4','2000-03-02'),(50,3,'argh5','2000-04-02'),(60,'argh6','2000-05-02');
-- the query
WITH parent_filter AS
(
SELECT
parent_id
FROM
tchild
WHERE
c4>44
)
SELECT
p.*,c.*
FROM
tparent p
JOIN tchild c ON p.id = c.parent_id
JOIN parent_filter pf ON p.id = pf.parent_id;
它为父 ID 1 和子 ID 10、20、30 返回 3 行,因为子 ID 30 有匹配记录。它不会返回任何其他父 ID 的数据。
但是,我在这里查询了两次 tchild
(首先在 CTE 中,然后在主查询中再次查询)。由于两个表都相对较大(10 到 100 百万行,平均每个父记录有 2-5 个子记录),我遇到了性能/时间问题。
有没有更好的方法来实现这种过滤? IE。无需多次查询 tchild
表?
解决方法
你试过这个版本吗?
SELECT *
FROM tparent p
JOIN tchild c ON p.id = c.parent_id AND <criteria>
通过这种方式,您可以在实际加入之前使用 createria 限制 tchild 表
,也许你可以用它来代替:
select p.*,c.*
from tparent p
join tchild c
on p.id = c.parent_id
where exists (select 1 from tchild where <crtiteria>)
当子表中至少有一条记录符合条件时,这应该检索父子连接的所有行。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。