
Hive
文章平均质量分 86
恋喵大鲤鱼
一条不止于编码的鱼。
展开
-
Hive 变量定义与引用
通过定义变量并在查询中引用变量,可以使查询语句更加简洁和易读。如果需要修改常量或固定值,只需要修改变量的值即可,而不需要修改所有引用该常量或固定值的查询语句。例如,可以将一些常用的查询条件或参数定义为变量,并在多个查询中引用这些变量,从而避免重复编写相同的查询语句。例如,可以将一些参数定义为变量,并在运行时动态修改这些参数的值,从而使查询语句具有更高的适应性和可配置性。总之,自定义变量和引用变量是一种良好的编程习惯,可以使查询语句更加简洁、易读、易于维护和重用,并提高查询语句的灵活性和可配置性。原创 2024-05-24 17:26:47 · 1291 阅读 · 0 评论 -
Hive 与 SQL 标准和主流 SQL DB 的语法区别
Hive是一种基于Hadoop的数据仓库软件,可以将结构化数据文件映射为一张数据库表,并提供了类SQL查询接口,使得用户可以使用SQL类语言来查询数据。Hive可以处理包括文本、CSV、JSON、ORC和Parquet等格式的数据文件,支持数据的导入、导出、转换等操作。Hive可以在Hadoop集群上运行,利用Hadoop的分布式计算能力,可以处理大规模的数据集。原创 2024-05-11 23:36:40 · 1700 阅读 · 3 评论 -
Hive 表定义主键约束
在 Hive 中,可以使用 PRIMARY KEY 子句来定义主键约束,以确保表中的每行数据都具有唯一标识。如果一个约束指定 RELY,也就是希望 HIVE 基于代价的优化器 CBO(Cost-Based Optimizer)使用约束信息来获得更好的统计信息,得到更好的执行计划。具体到主键约束,一般主键常用于多表关联查询,利用主键约束,可以删除不必要的连接( JOIN ELIMINATION),得到更好的执行计划。对于唯一约束,目前 Hive 是不支持的,但是其他一些约束是支持的。原创 2024-04-29 11:58:44 · 1870 阅读 · 3 评论