
大数据
文章平均质量分 90
TheoGo
这个作者很懒,什么都没留下…
展开
-
Greenplum基础及下载(整理)
下载:https://github.com/greenplum-db/gpdb基础知识:http://www.jpblog.cn/archives/1942一、基本语法二、常用数据类型1、数值类型2、字符类型3、时间类型三、常用函数1、字符串函数2、时间函数3、数值计算函数4、其他常用函数四、Greenplum实战转载 2016-02-10 10:26:05 · 7817 阅读 · 0 评论 -
大数据分析之Hadoop工具应用(精彩)
出处:http://wenku.baidu.com/view/a6e1227b2f60ddccdb38a00d.html介绍hdfs\hbase转载 2016-02-26 08:34:02 · 561 阅读 · 0 评论 -
低调奢华有内涵的敏捷式大数据方案:Cassandra+Presto(结合SpagoBI+Flume)
1 概述“Ad-hoc analysis over Cassandradata with Facebook Presto”一文,对Cassandra+Presto结合实现大数据即席分析进行了介绍。Presto是为满足交互式即席查询需求而优化的分布式SQL查询引擎。它支持标准ANSI SQL,包括复杂查询,聚合,连接和窗口函数。Cassandra以前缺少交互式即席查询功能,甚转载 2016-02-26 08:18:46 · 2466 阅读 · 0 评论 -
Cloudera Manager (centos)安装详细介绍
出处:http://www.aboutyun.com/thread-9190-1-1.html这里已经有很多关于CDH的文章,此篇虽然不是把所有的问题都描述了。但是整体的过程还算描述的比较清楚。问题导读:1.安装需要做哪些准备?2.如何安装CM?3.如何通过CM安装CDH?4.CM及CDH安装的过程都包含什么?相信通过这篇文章大家都对Cloude转载 2016-02-24 08:34:02 · 960 阅读 · 0 评论 -
大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术
大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术出处:http://www.aboutyun.com/thread-6842-1-1.html大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来。为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选择合适的技术,了解大转载 2016-02-24 08:32:12 · 1222 阅读 · 0 评论 -
Cloudera Manager、CDH零基础入门、线路指导
Cloudera Manager、CDH零基础入门、线路指导出处:http://www.aboutyun.com/thread-9219-1-1.html问题导读:1.什么是cloudera CM 、CDH?2.CDH、CM有哪些版本?3.CDH、CM有哪些安装方式?4.CDH如何开发? 我们知道cloudera CDH 是为简化hadoop的安装,转载 2016-02-24 08:20:37 · 2623 阅读 · 1 评论 -
CDH5上安装Hive,HBase,Impala,Spark等服务
出处:http://blog.youkuaiyun.com/yangzhaohui168/article/details/33403555Apache Hadoop的服务的部署比较繁琐,需要手工编辑配置文件、下载依赖包等。Cloudera Manager以GUI的方式的管理CDH集群,提供向导式的安装步骤。由于需要对Hive,HBase,Impala,Spark进行功能测试,就采用了Clouder转载 2016-02-24 08:18:21 · 1789 阅读 · 0 评论 -
剖析淘宝TDDL
TDDL(TAOBAO DISTRIBUTE DATA LAYER)引用http://gao-xianglong.iteye.com/blog/2019729/ 、 http://gao-xianglong.iteye.com/blog/1973591 前言在开始讲解淘宝的TDDL(Taobao Distribute Data Layer)技术之前,请允许笔者先吐槽一番。首先要转载 2016-03-08 18:04:38 · 1477 阅读 · 0 评论 -
大众点评数据平台架构变迁
出处:http://blog.youkuaiyun.com/yfkiss/article/details/16838941最近和其他公司的同学对数据平台的发展题做了一些沟通,发现各自遇到的问题都类似,架构的变迁也有一定的相似性。以下从数据&架构&应用的角度对2012.07-2014.12期间大众点评数据平台的架构变迁做一个概括性的总结,希望对还处在数据平台发展初期的同学有一些帮助,欢迎线下沟通转载 2016-03-17 08:42:52 · 763 阅读 · 0 评论 -
NoSQL 数据库的类型一览表
http://blog.youkuaiyun.com/defonds/article/details/48471087NoSQL 数据库的类型一览表数据库类型描述主流产品有谁在用适用场景不适用场景键值(Key-Value)数据库键值数据库就像在传统语言中使用的哈希表。你可以通过 key 来添加、查询或者删除数据,鉴于使用主键访问,所以转载 2016-02-10 11:28:33 · 783 阅读 · 0 评论 -
开源大数据查询分析引擎现状201506
出处:http://www.36dsj.com/archives/30017叶蓬 【按:此文是与我的《基于大数据分析的安全管理平台技术研究及应用》同期发表在内刊上的我的同事们的作品,转载于此。这些基础性的研究和测试对比分析,对于我们的BDSA技术路线选定大有帮助。】引言大数据查询分析是云计算中核心问题之一,自从Google在2006年之前的几篇论文奠定云计算领域转载 2016-02-26 08:43:01 · 874 阅读 · 0 评论