Hadoop Reading List

[说明:之前的那篇<<分布式系统领域经典论文翻译集>>颇显庞杂,涵盖内容五花八门,也有人提出不知道从哪开始。所以呢,就有了这一篇,主要以组成Hadoop生态系统的各组件为线索,串起了其中相对重要的那些论文,同时基本上也是按照从前往后的顺序由浅入深的,其中也包含了翻译集中所未出现的一些。这些文章中,标为(译)的那些是本人翻译的,标为(zz)的那些是其他人的译文或原创,剩余未标明的部分基本上是英文原文,可能会择其要者而译之。]

1.HDFS 

GFS:google文件系统(译)

Case Study GFS: Evolution on Fast-forward(译)

The Hadoop Distributed File System(译)

HDFS scalability:the limits to growth(译)

HDFS Reliability

2.MapReduce   

MapReduce: Simplied Data Processing on Large Clusters(译)

关于MapReduce的争论

MapReduce和并行数据库,朋友还是敌人?(zz)

MapReduce:一个巨大的倒退(zz)

MapReduce:一个巨大的倒退(II)

A Comparision of Approaches to Large-Scale Data Analysis(译)

MapReduce-A Flexible Data Processing Tool(译)

MapReduce and Parallel DBMSs-Friends or Foes(译)

MapReduce Online

Hadoop公平调度器指南(zz)

Hadoop MapReduce 源码分析 

3.HBase  

Bigtable: A Distributed Storage System for Structured Data(译)

HBase Architecture(译)

HFile:A Block-Indexed File Format to Store Sorted Key-Value Pairs

HFile V2

LevelDB:一个快速轻量级的key-value存储库(译)

LevelDB:实现(译)

LevelDB:源码分析

4.Zookeeper 

Chubby: The Chubby lock service for loosely-coupled distributed systems(译)

ZooKeeper: Wait-free coordination for Internet-scale systems

5.Hive

Sawzall:Interpreting the Data--Parallel Analysis with Sawzall(zz)

Hive – A Petabyte Scale Data Warehouse Using Hadoop(zz)

Hive - A Warehousing Solution Over a Map-Reduce Framework

HIVE RCFile高效存储结构(zz)

RCFile: A Fast and Space-efficient Data Placement Structure in MapReduce-based Warehouse Systems

Pig Latin 分析报告(zz)

Tenzing- A SQL Implemention On The MapReduce Framework(译)

6.优化相关 

Hadoop平台优化综述(zz)

Hadoop作业调优参数整理及原理(zz)

Hadoop性能调优(zz)

HBase性能调优(zz)

HBase性能深度分析(zz)

HBase Performance Tuning

Hadoop Performance Evaluation

The Performance of MapReduce: An Indepth Study

Optimizing Hadoop for the cluster

Starfish: A Selftuning System for Big Data Analytics

To Compress or Not To Compress - Compute vs. IO tradeoffs for MapReduce Energy Efficiency 

7.综合与其他

Apache Hadoop Goes Realtime at Facebook(译)

The Anatomy of Hadoop I/O Pipeline(译)

下一代Apache Hadoop MapReduce(zz)

Apache Hadoop 0.23 

Avro: 大数据的数据格式(zz)

注:

转载请注明作者:phylips@bmy 2011-10-7

出处:http://duanple.blog.163.com/blog/static/7097176720119791920962/

Raft(Paxos) : https://raft.github.io/#implementations


### 解决 'suo: command not found' 错误 `suo: command not found` 错误通常意味着系统中没有 `suo` 这个命令,可能是用户输入错误,一般想要使用的是 `sudo` 命令。如果是输入错误,后续使用时正确输入 `sudo` 即可。 ### 解决 ubuntu apt-get update 时无法连接 archive.ubuntukylin.com:10006 的问题 当在执行 `apt-get update` 时无法连接 `archive.ubuntukylin.com:10006`,可能是网络问题、源地址错误或者该服务器暂时不可用。可以尝试以下方法: 1. **更新下载源**:使用 `sudo apt-get update` 命令更新 `/etc/apt/sources.list` 和 `/etc/apt/sources.list.d` 中列出的源的地址,以获取最新的软件包信息。 ```bash sudo apt-get update ``` 2. **更换软件源**:编辑 `/etc/apt/sources.list` 文件,将其中的 `archive.ubuntukylin.com` 替换为其他可用的软件源地址,例如阿里云源。 ```bash sudo nano /etc/apt/sources.list ``` 将文件内容替换为阿里云源的配置: ```plaintext deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse deb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse ``` 保存并退出后,再次执行 `sudo apt-get update`。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值