
分布式
文章平均质量分 78
徐不依
这个作者很懒,什么都没留下…
展开
-
Kylin简介
Kylin简介 使命是超高速的大数据OLAP(Online Analytical Processing),也就是要让大数据分析像使用数据库一样简单迅速,用户的查询请求可以在秒内返回。 Hadoop Hadoop诞生以来,大数据的存储和批处理问题均得到了妥善解决,而如何高速地分析数据也就成为了下一个挑战。于是各式各 样的“SQL on Hadoop”技术应运而生,其中以Hive为代表,Impala、...原创 2018-12-13 16:45:38 · 790 阅读 · 0 评论 -
Kylin快速入门
在Hive中准备数据 Hive 需要被分析的数据必须先保存为Hive表的形式,然后Kylin才能 从Hive中导入数据,创建Cube。Apache Hive是一个基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为数 据库表,并可以将SQL语句转换为MapReduce或Tez任务进行运行,从而让 用户以类SQL(HiveQL,也称HQL)的方式管理和查询Hadoop上的海量数据 星...原创 2018-12-13 16:55:44 · 302 阅读 · 0 评论 -
Spark入门 -- Spark图计算GraphX介绍及实例
http://www.doc88.com/p-3874973145414.html https://www.cnblogs.com/shishanyuan/p/4747793.html https://endymecy.gitbooks.io/spark-graphx-source-analysis/content/原创 2019-01-16 17:07:03 · 1281 阅读 · 1 评论 -
Kafka,Spark, Yarn简介
昨天听了manager从Google Cloud开发者大会2019回来的报告,发现自己对大数据里面很多基础知识都不懂好惭愧,最近空空闲时间学习一下相关的概念,记录在这里。因为发现了这个博客总结得很好,大部分内容都是搬运来的。 参考http://www.cnblogs.com/BYRans/ kafka: Kafka简介https://www.cnblogs.com/BYRans/p/...原创 2019-05-08 10:33:28 · 676 阅读 · 0 评论