
大数据
_宇宙浪子_
与其遥望远方,不如说走就走~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
十道海量数据处理面试题与十个方法大总结
转自:http://blog.youkuaiyun.com/v_july_v/article/details/6279498海量数据处理:十道面试题与十个海量数据处理方法总结作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://转载 2014-09-14 17:20:24 · 558 阅读 · 0 评论 -
超强、超详细Redis入门教程
转自:http://www.h5min.cn/article/56448.htm这篇文章主要介绍了超强、超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需要的朋友可以参考下【本教程目录】1.redis是什么2.redis的作者何许人也3.谁在使用redis4.学会安装redis5.学会启动redis6.使用redis客户端转载 2017-12-28 12:05:08 · 517 阅读 · 0 评论 -
全文索引原理及范例
全文检索是对大数据文本进行索引,在建立的索引中对要查找的单词进行进行搜索,定位哪些文本数据包括要搜索的单词。因此,全文检索的全部工作就是建立索引和在索引中搜索定位,所有的工作都是围绕这两个来进行的。下面就逐个介绍。 建立全文索引中有两项非常重要,一个是如何对文本进行分词,一是建立索引的数据结构。分词的方法基本上是二元分词法、最大匹配法和统计方法。索引的数据结构基本上采用倒排索引的结构。转载 2016-03-25 18:06:38 · 663 阅读 · 0 评论 -
大数据时代之hadoop(五):hadoop 分布式计算框架(MapReduce)
[置顶] 大数据时代之hadoop(五):hadoop 分布式计算框架(MapReduce)分类: hadoop 大数据2014-11-03 10:33 555人阅读 评论(1) 收藏 举报hadoop分布式计算mapreduce输入输出格式shuffle目录(?)[+] 大数据时代之hadoop(一):hadoop安装大转载 2014-11-14 14:35:41 · 793 阅读 · 0 评论 -
大数据时代之hadoop(一):hadoop安装
[置顶] 大数据时代之hadoop(一):hadoop安装分类: 大数据 hadoop2014-10-13 09:37 1022人阅读 评论(2) 收藏 举报hadoop大数据安装eclipse插件目录(?)[+] 1、hadoop版本介绍 0.20.2版本以前(不含该版本)的配置文件都在default.xm转载 2014-11-14 14:30:47 · 435 阅读 · 0 评论 -
大数据时代之hadoop(三):hadoop数据流(生命周期)
[置顶] 大数据时代之hadoop(三):hadoop数据流(生命周期)分类: hadoop 大数据2014-10-15 09:38 828人阅读 评论(0) 收藏 举报hadoop数据流生命周期目录(?)[+] 大数据时代之hadoop(一):hadoop安装大数据时代之hadoop(二):hadoop脚本解析转载 2014-11-14 14:33:24 · 901 阅读 · 0 评论 -
大数据时代之hadoop(六):hadoop 生态圈(pig,hive,hbase,ZooKeeper,Sqoop)
[置顶] 大数据时代之hadoop(六):hadoop 生态圈(pig,hive,hbase,ZooKeeper,Sqoop)分类: hadoop 大数据2014-11-11 08:40 942人阅读 评论(2) 收藏 举报hadoopzookeeperhbasehivepig目录(?)[+]大数据时代之hadoop(一):hadoop安转载 2014-11-14 14:36:59 · 843 阅读 · 0 评论 -
大数据时代之hadoop(二):hadoop脚本解析
[置顶] 大数据时代之hadoop(二):hadoop脚本解析分类: hadoop 大数据2014-10-14 09:35 2125人阅读 评论(3) 收藏 举报hadoop脚本安装启动解析目录(?)[+]大数据时代之hadoop(一):hadoop安装“兵马未动,粮草先行”,要想深入的了解ha转载 2014-11-14 14:31:58 · 526 阅读 · 0 评论 -
大数据时代之hadoop(四):hadoop 分布式文件系统(HDFS)
[置顶] 大数据时代之hadoop(四):hadoop 分布式文件系统(HDFS)分类: hadoop 大数据2014-10-20 09:46 676人阅读 评论(1) 收藏 举报hadoop文件系统hdfs分布式文件系统目录(?)[+] 大数据时代之hadoop(一):hadoop安装大数据时代之hadoop(转载 2014-11-14 14:34:51 · 863 阅读 · 0 评论 -
Spark on Yarn | Spark,从入门到精通
转载声明:本文转载自「美图数据技术团队」,搜索「美图数据技术团队」即可关注。/ 为什么需要 Yarn? /Yarn的全称是Yet Anther Resource Negotiator(另一种资源协商者)。它作为 Hadoop的一个组件,官方对它的定义是一个工作调度和集群资源管理的框架。Yarn最早出现于Hadoop 0.23分支中,0.23分支是一个...转载 2019-05-06 14:38:54 · 205 阅读 · 0 评论