数据仓库以及Hive的使用总结

本文总结了数据仓库的概念,区分了OLTP和OLAP的特性,并详细介绍了Hive的功能,包括ETL、数据存储管理及大数据查询分析。Hive具有高扩展性和良好的容错性,适用于大数据的离线处理,支持HQL查询,常用于日志分析和多维度数据分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、数据仓库

  • 数据仓库是数据库的清理和集成,是新型决策管理信息系统的解决方案。
  • 区分OLTP和OLAP:OLTP是联机事务处理,侧重于事务的实时处理,如CUD操作,由数据库辅助完成;OLAP是联机分析处理,支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,快速灵活的处理数据,直观易懂的查询数据结果。
  • 数据仓库一般包括:数据层、应用层(分析、处理、挖掘)、表现层
       下面是OLAP的大致过程:

          


2、·Hive数据仓库


1)功能

  • ETL功能
  • 数据存储管理
  • 对大数据的查询和分析
2)特点
  • 延时高、高扩展性(自适应机器的数量和数据量的变化)
  • 无数据排序和查询cache功能
  • 不支持在线事务处理
  • 不提供实时的查询和记录更新
  • 良好的容错性
3)数据结构
  • 内部表&#x
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值