HiveQL:视图
视图可以允许保存一个查询,并向对待表一样对这个查询进行操作。这是一个逻辑结构,因为它不像一个表会存储数据。换句话说,Hive 目前暂不支持物化视图。
当一个查询引用一个视图时,这个视图所定义的查询语句将和用户的查询语句组合在一起,然后供 Hive 制定查询计划。从逻辑上讲,可以想象为 Hive 先执行这个视图,然后使用这个结果进行余下后续的查询。
1. 使用视图降低查询复杂度
比如下面的一个嵌套查询的例子。
FROM (
SELECT * FROM people JOIN cart
ON (cart.people_id=people.id) WHERE firstname='john'
) a SELECT a.lastname WHERE a.id=3;
我们把嵌套子查询变成一个视图。
CREATE VIEW shorter_join AS
SELECT * FROM people JOIN cart
ON (cart.people_id=people.id) WHERE firstname='john';
那么原来的查询就得到了极大的简化。
SELECT lastname FROM shorter_join WHERE id=3;
2. 使用视图来限制基于条件过滤的数据
对于视图来说,一个常见的使用场景就是基于一个或多个列的值来限制输出结果。有些数据库允许将视图作为一个安全机制,也就是不给用户直接访问具有敏感数据的原始表,而是提供给用户一个通过 WHERE 子句限制了的视图,以供访问。
Hive 目前并不支持这个功能,因为用户必须具有能够访问整个底层原始表的权限,这时视图才能工作。然而,通过创建视图来限制数据访问可以用来保护信息不被随意查询。
CREATE TABLE userinfo (
firstname string,
lastname string,
ssn string,
password string);
CREATE VIEW safer_user_info AS
SELECT firstname,lastname FROM userinfo;
如下是通过 WHERE 子句限制数据访问的视图的一个例子。在这种情况下,我们希望提供一个员工表视图,只暴露来自特定部门的员工信息。
CREATE TABLE employee (
firstname string,
lastname string,
ssn string,
password string,
department string);
CREATE VIEW techops_employee AS
SELECT firstname,lastname,ssn FROM userinfo WERE department='techops';
参考:《Hive 编程指南》
本文介绍了HiveQL中的视图功能,它允许将复杂的查询保存为视图,以简化后续的查询操作。视图是一个逻辑结构,不存储数据,而是在查询时结合用户查询动态生成查询计划。示例展示了如何通过视图降低查询复杂度,如将嵌套查询转化为简单视图。此外,还讨论了视图在限制数据访问方面的作用,虽然Hive不支持基于权限的视图,但可以通过创建视图来限制敏感信息的直接访问。最后,给出了两个视图应用示例,包括筛选特定部门员工信息的视图。
1031





