spark sql correlated scalar subqueries must be aggregated 错误解决

Spark SQL 解决correlated scalar subqueries must be aggregated错误

最新推荐文章于 2025-02-17 15:12:28 发布

转载

最新推荐文章于 2025-02-17 15:12:28 发布 · 1.7k 阅读

2 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/chenfool/p/11179438.html

文章标签：

#大数据 #数据库

在使用Spark SQL进行表报处理时遇到'correlated scalar subqueries must be aggregated'错误。问题源于子查询可能返回多个结果，Spark SQL要求子查询聚合。解决方法是在子查询中添加Max()函数确保返回唯一结果。

最近在客户中使用spark sql 做一些表报处理，但是在做数据关联时，老是遇到 “correlated scalar subqueries must be aggregated” 错误

举一个例子，这个sql 在oracle 或者 postgresql 都是可以正常运行的，但是在spark sql 就会报错“correlated scalar subqueries must be aggregated”

SELECT   A.dep_id,
         A.employee_id,
         A.age,
         (SELECT  age FROM employee B WHERE A.dep_id = B.dep_id) max_age
FROM     employee A
ORDER BY 1,2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30275415

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Lixora's DB Home

03-05

452

是指将子查询的结果预先计算并存储，然后在外部查询中直接使用该值，而不是每次外部查询的每一行都重新计算子查询。这种技术可以提高查询的性能，因为它避免了重复计算子查询。然后，它会将结果存储在一个临时表或哈希表中。接下来，当执行外部查询时，它可以直接从临时表或哈希表中获取每个客户的订单数量，而不需要重新计算。这种技术可以显著提高查询性能，但它也增加了查询优化的复杂性，因为优化器需要决定何时以及如何执行这种展开。如果没有进行Scalar相关子查询展开，那么对于。表中的每一行，都会执行一次子查询来计算订单数量。

23. SparkSQL - The correlated scalar subquery can only contain equality predicates

元元的李树专栏

11-08

694

23. SparkSQL - The correlated scalar subquery can only contain equality predicates https://stackoverflow.com/questions/41631199/sparksql-the-correlated-scalar-subquery-can-only-contain-equality-pred...

参与评论您还未登录，请先登录后发表或查看评论

select报错 spark_spark sql correlated scalar subqueries must be aggregated 错误解决

weixin_42361708的博客

01-14

1132

最近在客户中使用spark sql 做一些表报处理，但是在做数据关联时，老是遇到 “correlated scalar subqueries must be aggregated” 错误举一个例子，这个sql 在oracle 或者 postgresql 都是可以正常运行的，但是在spark sql 就会报错“correlated scalar subqueries must be aggregat...

a1264716408的博客

08-17

1721

http://blog.163.com/wkyuyang_001/blog/static/10802122820091751358252/ oracle中的相关子查询(correlated subqueries) 以前我们曾介绍过oracle中的嵌套子查询，你可以在你需要的任何位置(除了group by子句)使用嵌套之查询，例如常用的where子句位置，你也可以在hav

MySQL 8.0-13.2.11.7 Correlated Subqueries(关联子查询)

tangwenqiang177的专栏

11-09

1836

Column name must be either a string or an array yii

weixin_34345560的博客

09-19

565

Column name must be either a string or an arrayyii报错，半天没找到错误，结果才发现表没有定义主键。转载于:https://blog.51cto.com/here2142/1555170

Spark SQL案例：分组排行榜

weixin_54425212的博客

06-16

600

同一个学生有多门成绩，现需要计算每个学生分数最高的前3个成绩数据表预备工作：启动集群的HDFS与Spark 执行上述语句

Spark SQL 总结整理(二)：Spark SQL 解析流程、工作原理

super_wj0820的博客

09-18

3176

Spark SQL对SQL语句的处理和关系型数据库类似，即词法/语法解析、绑定、优化、执行。Spark SQL会先将SQL语句解析成一棵树，然后使用规则(Rule)对Tree进行绑定、优化等处理过程 1. Spark SQL运行架构由上图看出，Spark SQL 的解析流程为： 1. 使用 SessionCatalog 保存元数据在解析SQL语句之前，会创建 SparkSession，或者如...

高级sql技巧

最新发布

qq_52380715的博客

02-17

1619

【代码】高级sql。

用hive语句走过的坑

Tina_java的博客

01-25

1633

1.在sqlServer中有isnull 函数，但是hive不支持，只能用case when 字段 is null then 0 else 字段 end as 字段 2.hive join 表时 join 的表不能是带括号的，如果必须jion这种条件生成的表，需要根据条件生成临时表错误写法： spark.sql(""""select a.*,b.* from a join (selec...

clickhouse

11-19

clickhouse使用文档，包含了所有的操作，学习clickhouse必备

ocp标量子查询

提笔画秋风

03-12

546

标量子查询 Scalar Subquery Expressions A scalar subquery expression is a subquery that returns exactly one column value from one row. The value of the scalar subquery expression is the value of the select list item of the subquery. If the subquery returns 0 row

故障解决：spark 访问hive 库、表报错 org.apache.spark.sql.AnalysisException: Table or view not found

认知行动坚持

09-23

1万+

1、spark项目 + 外部配置文件【最优，如CDH平台，配置改变，无需重新编译、打包】 2、spark项目（resources目录下存放hive-site.xml）【次之，如果配置变动需要更新配置文件，重新编译打包】 3、spark项目（在代码中写死配置选项）【最差，涉及配置修改后，需要对代码修改，然后重新编译打包】 ...

PostgreSQL：ERROR,0A000,"cached plan must not change result type"

08-04

4077

今天发现数据库日志报大量如下错误，数据库版本: PostgreSQL 9.1.9。 --数据库错误日志 2013-07-24 15:11:35.895 CST,"db_test","db_test",17526,"192.168.100.221:40188",51ed7b10.4476,1555,"BIND",2013-07-23 02:33:52 CST

MySQL中的子查询用法

qq_43028054的博客

06-26

3800

子查询 导入知识 1.select字句的构成 select … from … where … group by having … order by 子查询 1.子查询是什么？查询里面嵌套查询，也就是select里面还有select select …(select) from …(select) where …(select) group by having …(select) order b...

【spark】异常：org.apache.spark.sql.AnalysisException: resolved attribute(s)