我们为什么做NDH

NDH是网易自研的大数据基础平台,源于内部多年的使用经验并对外销售。它体现了架构开放的理念,允许在不同数据平台上实现逻辑数据湖。尽管Hadoop发行版业务挑战重重,但NDH凭借其在批处理、交互式查询、数据仓库和流处理上的整合能力,以及平滑迁移和开放架构,展现出良好的发展前景。NDH未来将向云原生和湖仓方向演进,且部分核心技术会开源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前几天我们发布了个小产品叫NDH(官宣!网易数帆自研大数据基础平台,筑牢自主可控“数字底座”),大致来说就是一个网易版的Hadoop,类似CDH,没想到引起了IT大网红飞总的深深思考(Cloudera一己之力证明的火炕,网易却毫不犹豫跳进来。。。)。飞总为了证明我们是一群聪明人,不会做Hadoop发行版这种傻生意,blahblah帮我们想了很多理由。飞总不愧是飞总,技术上一针见血(我们有Impala和Kyuubi),融资上市抬估值的逻辑更是把我唬的一愣一愣的。

借此我也谈谈我们为什么做NDH。

首先,其实NDH并不是一个全新的产品。我们内部已经做了很多年了,音乐、严选、传媒、有道等BU都大量使用,对外也卖了5年了,只不过之前都是和我们的数据开发平台一起打包卖的,这次无非是把NDH这一层独立出来。

其次,把NDH独立出来可以说是我对架构开放的偏执态度的必然结果。

我之前给有数的团队提了一个要求,产品要模块化,拆分成多个客户可以单独购买的子产品,这样客户就不会被逼着买全家桶。很多客户已经有CDH、FusionInsight,总不能逼着客户为了用我们的数据研发或数据中台又得搞一套Hadoop集群吧?所以我命令团队一定要拆。

这一拆就拆出个逻辑数据湖的概念,就是我们的数据研发和数据中台都可以架设在客户已有的CDH、FusionInsight、Vertica、Oracle甚至MySQL(对的,甚至有在MySQL上做数据中台的,这个我一开始都想不到)上实现。这样出现了一些客户用了我们的逻辑数据湖,底层是CDH或FI。但客户用着用着,也被我们团队游说(我们不会逼客户,但游说还是会游说的),觉得CDH貌似挺贵也有风险,我们服务又不错,所以也想把底层换成我们的。这上门的生意总不能不做吧,所以NDH独立成产品也就是必然的了。

架构开放应该说是我作为架构师的偏执吧,因为生意角度证明不了,你说20多年前Bezos要求系统之间都得通过API是不是一种偏执?

最后,虽然Hadoop发行版长期看不大像是一门很好的生意,但我们认为NDH无论短期还是长期看

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值