You are viewing a plain text version of this content. The canonical link for it is here.
Posted to reviews@spark.apache.org by GitBox <gi...@apache.org> on 2019/07/11 22:58:26 UTC
[GitHub] [spark] imback82 opened a new pull request #25124: [SPARK-28282][SQL][PYTHON][TESTS] Convert and port 'inline-table.sql' into UDF test base

imback82 opened a new pull request #25124: [SPARK-28282][SQL][PYTHON][TESTS] Convert and port 'inline-table.sql' into UDF test base
URL: https://github.com/apache/spark/pull/25124
 
 
   ## What changes were proposed in this pull request?
   
   This PR adds some tests converted from `inline-table.sql` to test UDFs. Please see contribution guide of this umbrella ticket - [SPARK-27921](https://issues.apache.org/jira/browse/SPARK-27921).
   
   <details><summary>Diff comparing to 'inline-table.sql'</summary>
   <p>
   
   ```diff 
   diff --git a/sql/core/src/test/resources/sql-tests/results/inline-table.sql.out b/sql/core/src/test/resources/sql-tests/results/udf/udf-inline-table.sql.out
   index 4e80f0bda5..f2e2cd7c84 100644
   --- a/sql/core/src/test/resources/sql-tests/results/inline-table.sql.out
   +++ b/sql/core/src/test/resources/sql-tests/results/udf/udf-inline-table.sql.out
   @@ -19,17 +19,17 @@ one	1
    
    
    -- !query 2
   -select * from values ("one", 1) as data(a, b)
   +select udf(a), b from values ("one", 1) as data(a, b)
    -- !query 2 schema
   -struct<a:string,b:int>
   +struct<udf(a):string,b:int>
    -- !query 2 output
    one	1
    
    
    -- !query 3
   -select * from values 1, 2, 3 as data(a)
   +select udf(a) from values 1, 2, 3 as data(a)
    -- !query 3 schema
   -struct<a:int>
   +struct<udf(a):string>
    -- !query 3 output
    1
    2
   @@ -37,9 +37,9 @@ struct<a:int>
    
    
    -- !query 4
   -select * from values ("one", 1), ("two", 2), ("three", null) as data(a, b)
   +select udf(a), b from values ("one", 1), ("two", 2), ("three", null) as data(a, b)
    -- !query 4 schema
   -struct<a:string,b:int>
   +struct<udf(a):string,b:int>
    -- !query 4 output
    one	1
    three	NULL
   @@ -47,102 +47,102 @@ two	2
    
    
    -- !query 5
   -select * from values ("one", null), ("two", null) as data(a, b)
   +select udf(a), b from values ("one", null), ("two", null) as data(a, b)
    -- !query 5 schema
   -struct<a:string,b:null>
   +struct<udf(a):string,b:null>
    -- !query 5 output
    one	NULL
    two	NULL
    
    
    -- !query 6
   -select * from values ("one", 1), ("two", 2L) as data(a, b)
   +select udf(a), b from values ("one", 1), ("two", 2L) as data(a, b)
    -- !query 6 schema
   -struct<a:string,b:bigint>
   +struct<udf(a):string,b:bigint>
    -- !query 6 output
    one	1
    two	2
    
    
    -- !query 7
   -select * from values ("one", 1 + 0), ("two", 1 + 3L) as data(a, b)
   +select udf(a), udf(b) from values ("one", 1 + 0), ("two", 1 + 3L) as data(a, b)
    -- !query 7 schema
   -struct<a:string,b:bigint>
   +struct<udf(a):string,udf(b):string>
    -- !query 7 output
    one	1
    two	4
    
    
    -- !query 8
   -select * from values ("one", array(0, 1)), ("two", array(2, 3)) as data(a, b)
   +select udf(a), b from values ("one", array(0, 1)), ("two", array(2, 3)) as data(a, b)
    -- !query 8 schema
   -struct<a:string,b:array<int>>
   +struct<udf(a):string,b:array<int>>
    -- !query 8 output
    one	[0,1]
    two	[2,3]
    
    
    -- !query 9
   -select * from values ("one", 2.0), ("two", 3.0D) as data(a, b)
   +select udf(a), b from values ("one", 2.0), ("two", 3.0D) as data(a, b)
    -- !query 9 schema
   -struct<a:string,b:double>
   +struct<udf(a):string,b:double>
    -- !query 9 output
    one	2.0
    two	3.0
    
    
    -- !query 10
   -select * from values ("one", rand(5)), ("two", 3.0D) as data(a, b)
   +select udf(a), b from values ("one", rand(5)), ("two", 3.0D) as data(a, b)
    -- !query 10 schema
    struct<>
    -- !query 10 output
    org.apache.spark.sql.AnalysisException
   -cannot evaluate expression rand(5) in inline table definition; line 1 pos 29
   +cannot evaluate expression rand(5) in inline table definition; line 1 pos 37
    
    
    -- !query 11
   -select * from values ("one", 2.0), ("two") as data(a, b)
   +select udf(a), udf(b) from values ("one", 2.0), ("two") as data(a, b)
    -- !query 11 schema
    struct<>
    -- !query 11 output
    org.apache.spark.sql.AnalysisException
   -expected 2 columns but found 1 columns in row 1; line 1 pos 14
   +expected 2 columns but found 1 columns in row 1; line 1 pos 27
    
    
    -- !query 12
   -select * from values ("one", array(0, 1)), ("two", struct(1, 2)) as data(a, b)
   +select udf(a), udf(b) from values ("one", array(0, 1)), ("two", struct(1, 2)) as data(a, b)
    -- !query 12 schema
    struct<>
    -- !query 12 output
    org.apache.spark.sql.AnalysisException
   -incompatible types found in column b for inline table; line 1 pos 14
   +incompatible types found in column b for inline table; line 1 pos 27
    
    
    -- !query 13
   -select * from values ("one"), ("two") as data(a, b)
   +select udf(a), udf(b) from values ("one"), ("two") as data(a, b)
    -- !query 13 schema
    struct<>
    -- !query 13 output
    org.apache.spark.sql.AnalysisException
   -expected 2 columns but found 1 columns in row 0; line 1 pos 14
   +expected 2 columns but found 1 columns in row 0; line 1 pos 27
    
    
    -- !query 14
   -select * from values ("one", random_not_exist_func(1)), ("two", 2) as data(a, b)
   +select udf(a), udf(b) from values ("one", random_not_exist_func(1)), ("two", 2) as data(a, b)
    -- !query 14 schema
    struct<>
    -- !query 14 output
    org.apache.spark.sql.AnalysisException
   -Undefined function: 'random_not_exist_func'. This function is neither a registered temporary function nor a permanent function registered in the database 'default'.; line 1 pos 29
   +Undefined function: 'random_not_exist_func'. This function is neither a registered temporary function nor a permanent function registered in the database 'default'.; line 1 pos 42
    
    
    -- !query 15
   -select * from values ("one", count(1)), ("two", 2) as data(a, b)
   +select udf(a), udf(b) from values ("one", count(1)), ("two", 2) as data(a, b)
    -- !query 15 schema
    struct<>
    -- !query 15 output
    org.apache.spark.sql.AnalysisException
   -cannot evaluate expression count(1) in inline table definition; line 1 pos 29
   +cannot evaluate expression count(1) in inline table definition; line 1 pos 42
    
    
    -- !query 16
   
   ```
   </p>
   </details> 
   
   ## How was this patch tested?
   
   Tested as guided in [SPARK-27921](https://issues.apache.org/jira/browse/SPARK-27921).

----------------------------------------------------------------
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.
 
For queries about this service, please contact Infrastructure at:
users@infra.apache.org


With regards,
Apache Git Services

---------------------------------------------------------------------
To unsubscribe, e-mail: reviews-unsubscribe@spark.apache.org
For additional commands, e-mail: reviews-help@spark.apache.org