
Hadoop
小迁W️:m12330m
java 大数据 人工智能 架构师学习资料免费分享
展开
-
清华毕业大佬终于讲完了Hadoop,总计7.7个G,208集,值得收藏
前言 Hadoop是一个开源软件框架,用于在商用硬件集群上存储数据和运行应用程序。它为任何类型的数据提供海量存储,巨大的处理能力以及处理几乎无限的并发任务或作业的能力。 hadoop的优势 hadoop的优势主要体现在高可靠性,高扩展性等方面。 高可靠性是指多副本的存储机制和失败作业的重新调度计算。 高扩展性是指资源不够时很容易直接扩展机器。一个集群可以包含数以千计的节点。 其他优势还表现在:ha...原创 2020-03-14 17:22:25 · 507 阅读 · 0 评论 -
「资源」每天花5h来学习Hadoop+Spark大数据巨量分析与机器学习实战
本文的主题是Hadoop+Spark大数据分析与机器学习。众所周知,Hadoop是运用最多的大数据平台,然而Spark 异军突起,与Hadoop兼容而且运行速度更快,各大公司也开始加入Spark的开发。例如,IBM公司加入Apache Spark社区,打算培育百万名数据科学家。谷歌(Google)公司与微软公司也分别应用了Spark的功能来构建服务、发展大数据分析云与机器学习平台。这些大公司的加...原创 2020-03-07 18:02:15 · 853 阅读 · 1 评论 -
五年经验大佬带你掌握 基于Hadoop与Spark的大数据开发实战
前言: 本书以Hadoop和Spark为核心,阐述了基于这两种通用大数据处理平台的应用开发技术。 在Hadoop生态圈中,从HDFS初识分布式存储系统;以MapReduce详解f分布式计算的步骤;利用HBase分析适合非结构化数据存储的分布式数据库;利用Hive分析将SQL查询转化为分布式计算的过程;并结合项目案例“音乐排行榜”练习Hadoop核心技能点的运用;同时,介绍了几种离线处理系统中常...原创 2020-02-20 15:51:58 · 831 阅读 · 0 评论 -
清华大学从理论和实践,由浅入深,全方位介绍Hadoop这一高性能的海量数据处理和分析平台
内容简介 本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性 能的海量数据处理和分析平台。全书5部分24章,第I部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、 Hadoop分布式文件系统YARN、Hadoop 的I/O操作。第II部分介绍MapReduce,主题包括MapReduce应用开发: MapReduce 的工作机制、MapReduce 的类型与格式M...原创 2020-01-08 14:54:44 · 355 阅读 · 0 评论