如何在presto中首先运行子查询

如何解决如何在presto中首先运行子查询

我有以下查询

select * 
from Table1 
where NUMid in (select NUMid 
                from Table2 
                where email = 'xyz@gmail.com')

我的目的是从 table2 中获取电子邮件值等于 xyz@gmail.com 的所有 NUMid 的列表,并使用这些 NUMid 列表从 Table1 中进行查询

在 presto 中,查询首先运行外部查询。有没有办法运行和存储内部查询的结果,然后在 presto 的外部查询中使用它?

解决方法

优化器可以为所欲为。在这种情况下,它应该运行一次内部查询,然后本质上执行 JOIN(技术上是“半连接”)操作。

在许多数据库中,带有适当索引的 exists 解决了性能问题。

如果你想确保子查询只计算一次,你可以将它移到 ON 子句中。正确的等效查询如下所示:

select t1.* 
from Table1 t1 join
     (select distinct t2.NUMid 
      from Table2 t2
      where t2.email = 'xyz@gmail.com'
     ) t2
     on t1.NUMid = t2.NUMid;

select distinct 对于 join 代码与 in 代码等效很重要。但是,如果您知道没有重复项,则无需子查询就可以更通俗地编写:

select t1.* 
from Table1 t1 join
     Table2 t2
     on t1.NUMid = t2.NUMid
where t2.email = 'xyz@gmail.com'
,

Presto 和 Trino (formerly known as PrestoSQL) 将该查询作为“半连接”操作执行:它使用来自内部查询的行构建内存索引,并探测外部查询的行查询该索引。如果 value 存在,则发出来自外部查询的行,否则将其过滤掉。

在 Trino 的最新版本中,有一个称为“动态过滤”的功能,它允许查询引擎根据从内部查询动态获取的信息在源上动态过滤和修剪外部查询的数据。您可以在以下博文中阅读更多相关信息:

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?