
大数据入门
东大小太阳
这个作者很懒,什么都没留下…
展开
-
【大数据入门】Hadoop技术原理与应用之基于Hadoop的数据仓库Hive
Hadoop技术原理与应用之基于Hadoop的数据仓库Hive文章目录**Hadoop技术原理与应用之基于Hadoop的数据仓库Hive**@[toc]**6.1 概述**6.1.1 数据仓库概念6.1.2 传统数据仓库面临的挑战6.1.3 Hive简介6.1.4 Hive与Hadoop生态系统中其他组件的关系6.1.5 Hive与传统数据库的对比分析6.1.6 Hive在企业中的部署和应用**6.2 Hive系统架构****6.3 Hive工作原理**6.3.1 SQL语句转换成MapReduce作业的原创 2020-11-13 20:04:24 · 667 阅读 · 0 评论 -
【大数据入门】Macbook上VMware Fusion的Centos7虚拟机配置静态IP并允许上网的配置方法
Macbook上VMware Fusion的Centos7虚拟机配置静态IP并允许上网的配置方法一.先在VMware Fusion任务栏中点击虚拟机,网络适配器调成nat模式二.通过Mac终端进入VMware Fusion的vmnet8目录查看nat.conf内容Tip:红框里面的数据之后会用到查看dhcpd.conf内容三、获取DNS(在mac系统偏好设置——>网络——>高级——>DNS)可以点击加号添加DNS服务器(域名服务器),常见的可以设置为114.114.114.114或者8.8原创 2020-11-10 12:01:01 · 508 阅读 · 0 评论 -
【大数据入门】Hadoop技术原理与应用之MapReduce
第5章 MapReduce目录• 5.1 概述• 5.2 MapReduce体系结构• 5.3 MapReduce工作流程• 5.4 实例分析:WordCount• 5.5 MapReduce的具体应用• 5.6 MapReduce编程实践5.1.1分布式并行编程•“摩尔定律”, CPU性能大约每隔18个月翻一番•从2005年开始摩尔定律逐渐失效 ,需要处理的数据量快速增加,人们开始借助于分布式并行编程来提高程序性能•分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任原创 2020-11-07 19:19:34 · 1214 阅读 · 3 评论