You are viewing a plain text version of this content. The canonical link for it is here.

Posted to issues@spark.apache.org by "Yuming Wang (Jira)" <ji...@apache.org> on 2021/02/16 07:07:00 UTC

[jira] [Updated] (SPARK-34444) Pushdown scalar-subquery filter to FileSourceScan

     [ https://issues.apache.org/jira/browse/SPARK-34444?page=com.atlassian.jira.plugin.system.issuetabpanels:all-tabpanel ]

Yuming Wang updated SPARK-34444:
--------------------------------
    Description: 
We can pushdown {{a < (select max(d) from t2)}} to FileSourceScan:
{code:sql}
CREATE TABLE t1 using parquet AS SELECT id AS a, id AS b FROM range(500000000L);
CREATE TABLE t2 using parquet AS SELECT id AS d FROM range(20);
SELECT count(*) FROM t1 where a < (select max(d) from t2);
{code}


  was:
We can pushdown {{a < (select max(d) from t2)}} to FileSourceScan:
{code:java}
CREATE TABLE t1 using parquet AS SELECT id AS a, id AS b FROM range(500000000L);
CREATE TABLE t2 using parquet AS SELECT id AS d FROM range(20);
SELECT count(*) FROM t1 where a < (select max(d) from t2);
{code}



> Pushdown scalar-subquery filter to FileSourceScan
> -------------------------------------------------
>
>                 Key: SPARK-34444
>                 URL: https://issues.apache.org/jira/browse/SPARK-34444
>             Project: Spark
>          Issue Type: Improvement
>          Components: SQL
>    Affects Versions: 3.2.0
>            Reporter: Yuming Wang
>            Priority: Major
>
> We can pushdown {{a < (select max(d) from t2)}} to FileSourceScan:
> {code:sql}
> CREATE TABLE t1 using parquet AS SELECT id AS a, id AS b FROM range(500000000L);
> CREATE TABLE t2 using parquet AS SELECT id AS d FROM range(20);
> SELECT count(*) FROM t1 where a < (select max(d) from t2);
> {code}



--
This message was sent by Atlassian Jira
(v8.3.4#803005)

---------------------------------------------------------------------
To unsubscribe, e-mail: issues-unsubscribe@spark.apache.org
For additional commands, e-mail: issues-help@spark.apache.org