
分布式与云计算
文章平均质量分 89
mmc2015
北大信科学院,关注深度强化学习。http://net.pku.edu.cn/~maohangyu/
展开
-
一致性哈希算法及其在分布式系统中的应用
摘要本文将会从实际应用场景出发,介绍一致性哈希算法(Consistent Hashing)及其在分布式系统中的应用。首先本文会描述一个在日常开发中经常会遇到的问题场景,借此介绍一致性哈希算法以及这个算法如何解决此问题;接下来会对这个算法进行相对详细的描述,并讨论一些如虚拟节点等与此算法应用相关的话题。分布式缓存问题假设我们有一个网站,最近发现随着流量增加,服务器压力越来越大,之转载 2014-10-05 15:58:00 · 597 阅读 · 0 评论 -
MapReduce——wordcount
不要问为什么,现在的工作转向了网络路由协议的设计。传统的网络拓朴结构可以形象的表示为树结构,我们称之为“有中心的网络拓扑结构”,简单地认为很多流量请求最终会汇聚到主干网这样的路由中心,才能转发到下一条路径。传统的路由协议都是采用单路径路由的方式,简单地认为,从源到目的,所有的包都通过一条路径转发(如果某条最优路径出现了问题,再考虑下一条最优路径),其它链路处于备份状态或无效状态,并原创 2015-09-18 10:28:12 · 909 阅读 · 0 评论 -
windows下安装linux双系统
在看到文章《【图文绝对详细】Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04》之后,发现有些人不会安装linux系统。。。下面介绍一种简单的windows下安装linux双系统方法:1、下载ubuntu-14.04.3-desktop-amd64.iso镜像文件,解压到ubuntu-14-desktop文件夹中,执行里面的wubi原创 2015-10-26 18:04:19 · 1265 阅读 · 0 评论 -
MapReduce——EquivalentJoin
数据:两个文件分别4/5行hadoop@ubuntu:/usr/local/hadoop$ hdfs dfs -cat input/*a1 b1a1 b2a3 b3a4 b4a1 c1a1 c2a3 c3a3 c4a5 c5结果:a1 b2 c2a1 b2 c1a1 b1 c2a1 b1 c1a3 b3 c4a3原创 2015-09-20 20:35:50 · 841 阅读 · 0 评论 -
mapreduce——invertedindex
三个输入文件分别时3/2/2行:hadoop@ubuntu:/usr/local/hadoop$ hdfs dfs -cat input/*hadoop mapreduce sparkhadoop windowslinux windowshadoop wordcount inverted indexclass publicapache spark mapreduce原创 2015-09-20 20:32:15 · 1864 阅读 · 0 评论 -
MapReduce_Hadoop入门简介
内容摘自北大某课程。1)面临的挑战(从“scale-up”到“scale-out”):2)产业界现状:3)学术界现状:4)hadoop大数据处理框架:原创 2015-10-25 21:12:36 · 1012 阅读 · 0 评论 -
Hadoop基础教程之高级编程【自定义每个环节的实现】
从前面的学习中,我们了解到了MapReduce整个过程需要经过以下几个步骤:1.输入(input):将输入数据分成一个个split,并将split进一步拆成。2.映射(map):根据输入的进生处理,3.合并(combiner):合并中间相两同的key值。4.分区(Partition):将分成N分,分别送到下一环节。5.化简(Reduce):将中间结果合并,得转载 2015-11-01 16:21:14 · 950 阅读 · 0 评论 -
Hadoop的疑惑点(持续更新)
这里记录一些常见的疑惑点。1)一个机器上同时跑MR和HDFS框架,从而保证计算和存储数据的机器是同一个,避免网络消耗。Typically the compute nodes and the storage nodes are the same, that is, the MapReduce framework and the Hadoop Distributed File Sy原创 2015-10-30 11:13:57 · 609 阅读 · 0 评论 -
【图文绝对详细】Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
dblab.xmu.edu.cn/blog/install-hadoop原文作者:给力星你有多渴望,你有多付出http://dblab.xmu.edu.cn/blog/install-hadoop/大数据Hadoop【这篇文章确实非常详细】当开始着手实践Hadoop时,安装Hadoop往往会成为新手的一道门槛。尽管转载 2015-10-21 22:59:51 · 2526 阅读 · 0 评论 -
【图文详细】使用Eclipse编译运行MapReduce程序_Hadoop_2.4.1
给力星你有多渴望,你有多付出http://dblab.xmu.edu.cn/blog/hadoop-build-project-using-eclipse/大数据Hadoop,MapReduce上篇介绍了使用命令行编译打包运行自己的MapReduce程序,使用 Eclipse 更加方便。要在 Eclipse 上转载 2015-10-23 10:07:27 · 5155 阅读 · 0 评论 -
Google三驾马车——GFS、MapReduce、Bigtable
1、GFSGFS的一些假设:系统由许多廉价的普通组件组成,组件失效是一种常态。统的工作负载主要由两种读操作组成:大规模的流式读取和小规模的随机读取。系统的工作负载还包括许多大规模的、顺序的、数据追加方式的写操作。高性能的稳定网络带宽远比低延迟重要。GFS架构:租约保证原创 2014-10-05 15:58:44 · 11258 阅读 · 0 评论