HDFS:NameNode的Proxy该怎样做

最新推荐文章于 2024-12-19 11:32:36 发布

最新推荐文章于 2024-12-19 11:32:36 发布 · 617 阅读

文章标签：

#hdfs #namenode

hdfs 专栏收录该内容

3 篇文章

订阅专栏

本文探讨了如何在HDFS中实现文件订阅功能，通过在NameNode端引入代理层，拦截并处理用户对文件的操作请求，进而实现实时通知订阅方文件变更。此功能为HDFS增加了一项关键特性，有助于提升数据管理和监控效率。

[size=medium]
在上篇[url=http://langyu.iteye.com/blog/1165292]blog[/url]中提到了HDFS的功能扩展点：Service plugin，它存在于NameNode和DataNode中。HDFS赋予它们可以操作这两个大对象的能力，这也完全提供我们在HDFS上进行开发的机会。这些开发可以是对HDFS现有功能的补充与完善，也可以是基于HDFS之上的扩展。但server plugin可以知道当前用户正在操作哪些文件么？不知道

现在我们有这样的需求：需要HDFS提供file notification - 也就是订阅方可以在HDFS上订阅监控某个文件或目录，如果文件或目录有更改，订阅方可以及时得到来自HDFS的通知。类似的功能需求在大部分应用系统都会支持，所以我们也会试着来完善HDFS的这个功能。

所有与文件相关的操作都是来自client，这些操作通过NameNode提供的RPC接口进行数据处理。我们最先应该想到的是在哪里可以获得所有与client交互的请求呢？client端显然不现实：1. 它是临时的，不能长期提供服务； 2. 某个文件可被多个client操作，不能完全拦截用户操作。除client之外，NameNode肯定是可以完成需求的，但怎样修改是改动少，最稳妥的方式呢？我想到了NameNode端的RPC server，它持有NameNode instance，然后在每次RPC请求到达时，根据这个instance做方法调用，在这里我们就可以偷梁换柱，用我们想要的代理层来替代真实的NameNode，既可以做正常的方法调用转发，也可以实现我们的需求。[/size]

[img]http://dl.iteye.com/upload/attachment/549402/4683d703-ea85-3875-9d56-1c59b2cb0fa4.jpg[/img]

[size=medium]
在RPC server与NameNode之间加入这样一层“锲子”，它静态代理着所有对NameNode的请求(当然也有从DataNode来的请求，不过我们不处理它，因为我们想要的只要与HDFS文件或目录相关的操作)，然后在背后把请求的参数拦截下来，做异步处理，尽量不要影响NameNode的处理效率。

在NameNode中加入这个Proxy，RPC server就只会认为它是NameNode[/size]


//NameNode.java
NameNodeProxy nnProxy = new NameNodeProxy(this);
this.server = RPC.getServer(NamenodeProtocols.class, nnProxy,
                                socAddr.getHostName(), socAddr.getPort(),
                                handlerCount, false, conf, 
				namesystem.getDelegationTokenSecretManager());

[size=medium]
对于用户的这些文件操作请求，我们可以对它这样做。把请求代理到真正的NameNode，拦截请求参数，与订阅信息比对，如果匹配就通知订阅方[/size]


//NameNodeProxy.java
public void create(String src, 
          FsPermission masked,
          String clientName, 
          EnumSetWritable<CreateFlag> flag,
          boolean createParent,
          short replication,
          long blockSize) throws IOException {

    nameNode.create(src, masked, clientName, flag, createParent, replication, blockSize);

    putRequestToQueue(src, "create");
}

private List<Operation> operationQueue;

private void putRequestToQueue(String src, String cmd) {
    Operation op = new Operation(src, cmd);
    operationQueue.add(op);
}