
BigData
文章平均质量分 91
落雪2016
Miss X
展开
-
CentOS7环境搭建--Notes
00 CentOS环境搭建1 所需软件:VMware-player-12.5.1CentOS-7-x86_64-Minimal.isojdk-8u111-linux-x64.rpmhadoop-2.7.3.tar.gz2 安装流程:安装VMware在VMware上将CentOS7最小安装版安装到移动硬盘设置CentOS7,更改主机名,添加新用户配置ssh无密码登录安装JDK伪分布式安装Hadoop原创 2016-12-02 12:44:38 · 750 阅读 · 0 评论 -
HDFS介绍--Notes
01 HDFS介绍:Hadoop2介绍Hadoop是Apache软件基金会旗下的一个分布式系统基础架构,它为海量的数据提供了存储和计算。Hadoop2的框架最核心的设计就是HDFS、MapReduce和YARN。HDFS:Hadoop Distributed File Syste,分布式文件系统,主要用于海量数据存储。MapReduce:主要原创 2016-12-02 16:31:40 · 548 阅读 · 0 评论 -
大数据实战学习笔记 03
大数据实战学习笔记 03应用场景案例--海量地标定位酒店周边建筑1. 案例场景假设条件:60km*60km大小的城镇2000*1001个地理坐标其中有2000个是酒店实验要求:列出每个酒店1km范围内所有地标图 1题目图示2. 案例实现分析2.1 数据资源:图 2原始数据格式如上图所示,每一行数据分为四个字段,分别为地标标志、原创 2016-12-12 08:21:24 · 750 阅读 · 0 评论 -
大数据学习笔记2--待补全
1、 HBase简介 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建大规模结构化的存储集群。HBase的目标是存储并处理大型数据,具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和列所组成的大型数据。 与MapReduce的离线批处理计算框架不同,HBase是一个可以随机访问的存翻译 2016-12-05 07:59:48 · 600 阅读 · 0 评论