- 博客(3)
- 收藏
- 关注
原创 数据仓库 第3章 Hive函数与视图与索引
6.Hive内置函数介绍3。7.Hive内置函数介绍4。3.1Hive 窗口函数。6.窗口函数-聚合类。6.窗口函数-分析类。
2024-06-04 15:13:32
253
1
原创 数据仓库Hive元数据及查询操作
ALL和DISTINCT子句表示是否返回重复行,默认是ALL,返回所有匹配行。仅仅获取元数据而不操作的话,使用hive-metastore组件更加合适。hive-metastore,通过访问metastore服务实现。hive-metastore通过面向对象的方式访问数据库数据。Hive元数据存储在RDBMS中,有三种存储模式。元数据存储在Derby数据库,是默认的存储方式。远程服务模式,使用远程元数据服务访问数据库。2.2 Hive元数据的定义与操作存储。单用户模式,使用内置Derby数据库。
2024-06-04 15:09:54
688
原创 数据仓库技术与应用
然而,本地数据仓库的弹性较低,需要企业通过复杂的预测来确定如何扩展数据仓库,以满足未来需求。数据仓库能够集中、整合多个来源的大量数据,借助数据仓库的分析功能,企业可从数据中获得宝贵的业务洞察,改善决策。(1)外部表:因其指删除表时不会删除HDFS上的数据,安全性相对较高,且指定目录的特性,适合数据需要共享或者数据的处理需要 hive和其他工具一起处理的场景。沙盒:沙盒可提供一个专有的安全区域,帮助企业快速、非正式地探索新的数据集或新的数据分析方式,而无需遵守或遵循数据仓库的正式规则和协议。
2024-06-04 15:03:04
1038
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人