
大数据
皮皮大卫
学以致用,追求卓越!
展开
-
分布式数据库HBase
1、HBase是什么? HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,是谷歌BigTable的开源实现,主要用来存储非结构化和半结构化的松散数据。HBase的目标是处理非常庞大的表,可以通过水平扩展的方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表。Hadoop安装以后,不包含HBase组件,需要另外安装。 (1)HBase和BigTable的底层技术对应关系 (2)HBase的必要性(与HDFS和MapReduce的区别): •Hadoop...原创 2020-09-02 13:39:14 · 879 阅读 · 0 评论 -
大数据基础——大数据处理架构Hadoop
一、Hadoop是什么? (1)Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构 (2)Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中 (3)Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce (4)Hadoop被公认为行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力 (5)几乎所有主流厂商都围绕Had原创 2020-08-23 21:01:52 · 906 阅读 · 0 评论