大数据相关
大数据的基础知识
张茂祯
嗯,随缘了
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【大数据】Presto
Presto介绍 介绍 Presto是由FaceBook开发的,是一个运行在多台服务器上的分布式查询引擎,本身并不存储数据,但是可以接入多种数据源(Hive、Oracle、Mysql、Kafka、Redis等),并且支持跨数据源的级联查询。 select * from a join b where a.id = b.id #其中表a可以来自Hive,表b可以来自Mysql 优势:(相对于Hive) Presto是一个低延迟高并发的内存计算引擎,相比Hive,执行效率要过很多。 Presto以分析师的需求原创 2020-12-18 21:50:31 · 560 阅读 · 1 评论 -
【大数据】Hive
Hive概念 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并且提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 Hive是建立在Hadoop上的数据仓库基础构架。提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据。 Hive与关系数据库的区别: Hive和关系数据库存储文原创 2020-12-14 21:30:39 · 394 阅读 · 0 评论
分享