
Hadoop
kurobane
本博客主要以转载优秀的技术文章为主
展开
-
使用 Apache Hadoop 和 Dojo 降低商业智能成本,第 1 部分: 使用 Apache Hadoop 挖掘现有数据
【转载按】分布式框架HADOOP的一个实例介绍,详细讲解了HADOOP如何从一个大数据量的日志里面解析并聚合数据,即HADOOP标志性的MAP/REDUCE操作。【原文】http://www.ibm.com/developerworks/cn/web/wa-d转载 2011-07-03 17:11:33 · 321 阅读 · 0 评论 -
MapReduce:超大机群上的简单数据处理
http://blog.youkuaiyun.com/active1001/archive/2007/07/02/1675920.aspxMapReduce是一个编程模型,和处理,产生大数据集的相关实现.用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集转载 2011-04-01 11:47:00 · 351 阅读 · 0 评论 -
Hadoop入门系列文章
第1回いまさら聞けないHadoopとテキストマイニング入門http://www.atmarkit.co.jp/fjava/rensai4/hadoop_tm01/01.html第2回実践! 「MapReduceでテキストマイニング」徹底解説http://www.atmarkit.转载 2011-07-21 22:18:39 · 336 阅读 · 0 评论 -
MapReduce技术的初步了解与学习
http://blog.youkuaiyun.com/v_july_v/article/details/6637014MapReduce技术的初步了解与学习 --包含Google MapReduce中文版 今天咱们学习下MapReduce模型。由于是本人是初次接触,不是很了解。所以,有转载 2011-07-27 20:16:21 · 409 阅读 · 0 评论 -
大数据下的数据分析平台架构
http://www.programmer.com.cn/7617/ 随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常转载 2011-08-12 22:26:52 · 451 阅读 · 0 评论 -
视频网站的Big Data解决之道
http://www.programmer.com.cn/7615/ 概述 优酷作为一家大型视频网站,拥有海量播放流畅的视频。我们秉承注重用户体验这一产品技术理念,将绝大部分存储用在视频资源上。通过建设专用的视频CDN,建立了可自由扩展、性能优异的架构,在转载 2011-08-13 09:52:35 · 541 阅读 · 0 评论 -
深入理解Hadoop集群和网络
http://www.youkuaiyun.com/article/2012-08-30/2809380-understanding-hadoop-clusters-and-the-ne 摘要:本文将着重于讨论Hadoop集群的体系结构和方法,及它如何涉及到网络和服务器基础设施。开始我们先学习一下Hadoop集群运作的基础。 导读:云计算和Hadoop中网络是讨论得相对比较少的领域转载 2012-09-01 20:22:37 · 485 阅读 · 0 评论 -
Hadoop学习笔记(Day1:Hadoop家族体系、权威指南1、2.4章)
1)Hadoop家族体系 Hadoop家族成员概述 http://www.cnblogs.com/lucky-girl/p/3632765.html 这篇文章简明扼要地介绍了Hadoop家族各个成员的功能。 Hadoop家族学习路线图 http://blog.youkuaiyun.com/it_man/article/details/14899905 这篇文章除了介绍家族成原创 2017-03-29 23:18:42 · 859 阅读 · 0 评论