
Hadoop
文章平均质量分 81
陆勤
专注于从数据中学习,实现数据到商业价值的转化。
展开
-
Hadoop操作前准备工作
摘要:本文介绍Hadoop操作前的准备工作。关键词:Hadoop Linux JDK WinSCP原创 2014-02-28 06:12:24 · 2885 阅读 · 1 评论 -
Hadoop之MapReduce程序应用三
摘要:MapReduce程序进行数据去重。关键词:MapReduce 数据去重原创 2014-06-20 05:46:15 · 2333 阅读 · 0 评论 -
Hadoop之MapReduce程序应用一
摘要:MapReduce程序处理专利数据集。关键词:MapReduce程序 专利数据集原创 2014-06-18 06:20:36 · 3809 阅读 · 1 评论 -
Hadoop之MapReduce程序开发流程
摘要:MapReduce程序开发流程遵循算法思路、Mapper、Reducer、作业执行的步骤。原创 2014-06-05 05:57:51 · 3595 阅读 · 1 评论 -
Hadoop之HDFS文件操作
摘要:Hadoop之HDFS文件操作常有两种方式,命令行方式和JavaAPI方式。本文介绍如何利用这两种方式对HDFS文件进行操作。原创 2014-06-05 05:52:47 · 75045 阅读 · 3 评论 -
Hadoop之MapReduce程序分析
摘要:Hadoop之MapReduce程序包括三个部分:Mapper,Reducer和作业执行。本文介绍和分析MapReduce程序三部分结构。原创 2014-06-05 05:55:02 · 5949 阅读 · 2 评论 -
Hadoop生态系统
摘要:介绍Hadoop生态系统,从Hadoop生态系统有什么成员,成员能做什么和Hadoop生态系统能够提供大数据问题解决方案两方面来认识。关键词:Hadoop HDFS MapReduce HBase Hive Pig原创 2014-03-07 15:28:54 · 3845 阅读 · 0 评论 -
Hadoop之MapReduce
摘要:MapReduce是Hadoop的又一核心模块,从MapReduce是什么,MapReduce能做什么以及MapReduce的工作机制三方面认识MapReduce。关键词:Hadoop MapReduce 分布式处理原创 2014-03-17 20:58:17 · 43863 阅读 · 0 评论 -
Hadoop之HDFS
摘要:HDFS是Hadoop的核心模块之一,围绕HDFS是什么、HDFS的设计思想和HDFS的体系结构三方面来介绍。关键词:Hadoop HDFS 分布式存储系统原创 2014-03-09 11:35:36 · 23176 阅读 · 5 评论 -
Hadoop能做什么
摘要:本文从Hadoop的初衷、大数据时代背景、Hadoop的使用者来探讨“Hadoop能做什么”这个问题。关键词:Hadoop 大数据原创 2014-02-27 07:33:35 · 22480 阅读 · 2 评论 -
Hadoop全分布模式操作
摘要:介绍Hadoop全分布模式操作,实现真正意义上的集群架构。关键词:Hadoop 全分布模式 文件配置原创 2014-03-08 10:13:54 · 3643 阅读 · 0 评论 -
Hadoop伪分布模式操作
摘要:本文介绍Hadoop伪分布模式操作,适合于Hadoop学习、开发和调试。关键词:Hadoop 伪分布式 文件配置原创 2014-03-01 07:19:21 · 6757 阅读 · 0 评论 -
Hadoop是什么
本文从Hadoop的诞生经历、The Apache Haoop的介绍 和 Hadoop in Action 作者观点来认识Hadoop是什么这个问题。关键词:Hadoop Dung Cutting 开源 框架 大数据 分布式存储和处理原创 2014-02-23 21:56:59 · 19528 阅读 · 2 评论 -
HADOOP之MAPREDUCE程序应用二
摘要:MapReduce程序进行单词计数。关键词:MapReduce程序 单词计数原创 2014-06-20 05:44:05 · 1609 阅读 · 0 评论