
大数据的学习
EllisonPei
NULL
展开
-
Google在大数据方面的三篇神文
MapReduce:http://blog.youkuaiyun.com/active1001/archive/2007/07/02/1675920.aspxGFS:http://blog.youkuaiyun.com/xuleicsu/archive/2005/11/10/526386.aspxBigTale:http://blog.youkuaiyun.com/accesine960/archive/2006/02/0...转载 2019-04-12 10:56:04 · 225 阅读 · 0 评论 -
错误总结
centos7错误总结: 1、centos7配置完成后无法访问hadoop101:50070 ?1关闭防火墙systemctl stop firewalld.service2配置hdfs-site.xml<?xml version="1.0"?><configuration><property><name>dfs....原创 2019-08-14 19:50:34 · 109 阅读 · 0 评论 -
hadoop命令总结
1、Centos7 命令大全:https://blog.youkuaiyun.com/qq_40087415/article/details/79367151。 与Centos其他版本不同的地方:https://blog.youkuaiyun.com/xiaojin21cen/article/details/837141772、关闭NodeManager 、ResourceManager和Hi...原创 2019-08-14 19:48:37 · 154 阅读 · 0 评论 -
Hadoop相关知识点
1、修改虚拟机IP地址、用户名:vim /etc/sysconfig/network-scripts/ifcfg-eth0//永久性的修改主机名称,重启后能保持修改后的。hostnamectl set-hostname xxx 2、配置文件说明:Hadoop配置文件分两类:默认配置文件和自定义配置文件,只有用户想修改某一默认配置值时,才需要修改自定义配置文件,更改相应属...原创 2019-08-14 19:46:22 · 180 阅读 · 0 评论 -
大数据界域的文章
MapReduce:http://blog.youkuaiyun.com/active1001/archive/2007/07/02/1675920.aspxGFS:http://blog.youkuaiyun.com/xuleicsu/archive/2005/11/10/526386.aspxBigTale:http://blog.youkuaiyun.com/accesine960/archive/2006/02/09...转载 2019-08-14 19:45:11 · 172 阅读 · 0 评论 -
LInux操作命令总结
目录第1章 Linux入门1.1 概述1.2 Linux和Windows区别1.3 Centos下载地址第2章 VM与Linux的安装2.1 VMWare安装2.2 CentOS安装2.3 VMTools安装第3章 Linux文件与目录结构3.1 Linux文件3.2 Linux目录结构第4章 VI/VIM编辑器4.1 是什么4.2 测试数据...转载 2019-04-18 17:09:56 · 917 阅读 · 0 评论 -
CDH平台——Cloudera虚拟机入门
官方说明文档:https://www.cloudera.com/documentation/enterprise/5-13-x/topics/hbase.htmlApache Hbase :是一个可扩展,分布式,面向列的数据存储区。Apache HBase提供对HDFS上托管的大型数据集的实时读/写随机访问。Hive:数据仓库软件可以在分布式存储中读取,写入和管理大型数据集。使用与SQL非常相...原创 2019-04-12 11:03:48 · 605 阅读 · 0 评论 -
ETL过程详解
ETL讲解(很详细!!!)ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目至少1/3的时间,ETL设计的好坏直接关接到BI项目的成败。ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。在设计ETL的时候我...转载 2019-04-12 11:01:32 · 1878 阅读 · 1 评论 -
centos 7 命令总结
1、Centos7 命令大全:https://blog.youkuaiyun.com/qq_40087415/article/details/79367151。与Centos其他版本不同的地方:https://blog.youkuaiyun.com/xiaojin21cen/article/details/837141772、关闭NodeManager 、ResourceManager和HistoryManager...原创 2019-04-12 10:59:53 · 187 阅读 · 0 评论 -
Cloudera虚拟机入门
官方说明文档:https://www.cloudera.com/documentation/enterprise/5-13-x/topics/hbase.htmlApache Hbase :是一个可扩展,分布式,面向列的数据存储区。Apache HBase提供对HDFS上托管的大型数据集的实时读/写随机访问。Hive:数据仓库软件可以在分布式存储中读取,写入和管理大型数据集。使用与SQL非...原创 2019-08-14 19:54:48 · 231 阅读 · 0 评论