深度分析解耦合方案

本文深度分析了解耦合技术对软件的影响,指出解耦合方案在Bios、驱动程序和操作系统层面是透明的,且性能保持不变。解耦合可通过PCIe、SAS等网络实现,其中SAS因其成本效益成为更可行的选择。对比以太网和InfiniBand,SAS在成本和功耗方面更具优势。文章探讨了解耦合在数据中心和企业市场的潜力及挑战,强调了构建资源池的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

深度分析解耦合方案

——HCC媒体交流Q&A

    记者:解耦合后,重新耦合数据,这对软件方面有什么影响?

   廖恒:从软件方面而言,这个变化对于Bios、驱动程序或者操作系统上都是百分之百透明的。过去服务器节点直接连的是本地的盘,或者是连到JBOD上, 而通过解耦合这个方案重组之后,服务器看到的是经过虚拟化之后、扩展器拓扑的一个子集,对于任何一个服务器而言,其实还是一个DAS模式,所以没有任何软件的改变,而且从性能上来说,没有任何变动, 因为原有方案是HBA直连,解耦合的方案只不过多增加了一级扩展器。

   记者解耦合还有别的实现方案?

   廖恒当下提到解耦合,简单化而言就是每一个节点把存储剔除,那么就一定要有某一种Fabric网络把计算资源连到某些存储资源上面去,这个网络可以是PCIe,可以是SAS,可以是以太网,可以是Fibre Channel, 可以是Infiniband。如果是Fibre Channel, 这就是个SAN,大家都知道它很贵; 如果是PCIe, 这也在我们的研发中,因为这个技术组网还不太成熟,还需要1-2年或者2-3年的继续研发才能够解决问题。

  今天,在服务器领域、IO领域发货量最大的就是以太网和SAS。 比较以太网和SAS, 比如说这是一个以太网,这是一个网卡,这边是相对智能的JBOD,可以跑比如说iSCSI或者是FCoE,或NAS的某种协议。但纵览服务器的历史,存储带宽、DAS的带宽基本上和网络带宽有数量级的差别。主要是因为数据有一个放大的系数,网卡通常所接收的是一个前端的业务,可能是一个网页请求、或某种业务请求,要执行这个业务请求,就肯定要访问盘去读大量文件,并对其进行处理,生成一个结果再从网口发出去,这样就导致在响应请求的过程中产生了大约10倍于原有请求的数据。如果采用以太网,首先这个万兆网卡就已经损失了10倍的性能,更不要说跑这些协议还有很大的开销。所以,如果要跑以太网,比如说iSCSI,要达到同样性能就得靠100G的网卡,还得有一个很强悍的CPU,才能够把iSCSI或FCoE转换成硬盘能够接受的协议,功耗、开销、成本、延迟等都很大。所以, 从存储解耦合的角度来说,SAS可以说更便宜,而且更可行,因为这些都是大家今天在用的东西。

    记者:您对比了SAS和以太网,包括在CPU功耗,跟InfiniBand比呢?

    廖恒:InfiniBand比以太网就更贵了。在保证相同性能的前提下,InfiniBand或以太网的每端口成本都是SAS技术的5-10倍。 因为成本不光和生态圈大小相关, 当然这也是非常重要的因素。其实以太网生态圈是最大的,但是就服务器内的以太网的端口数而言,在服务器里不见得比SAS更多,因为每一台服务器盘的口数比网口还是多。

    记者:今天在华为看到的这个东西应该就是未来PCIe组网设备吧?

    廖恒:PMC也在开发PCIe的交换,这是对未来的展望。如果就单一设备而言,PCIe确实可以用,但如果把这个作为一个公开的外部接口就有很大的问题。因为PCIe今天来说还很不成熟。因为服务器节点、JBOD和Switch可能是完全不同的厂家生产的,它们之间有互联互通等一系列问题。 PCIe本身从协议上来讲还是一个扩展总线,它其实并不是一个组网协议,包括故障的隔离,热插拔等这些问题还非常多,也就是说,这个生态圈还是不成熟。

  但是,如果是去做一台优化的存储设备,那我相信PCIe是一个很好的选择,只要有这样的器件可以用上,因为你把这个东西做到一个盒子里面了,接口是不对外的,而且里面的软件、驱动程序等,甚至于连接的设备都是可能是同一个厂商提供,这样就可以做充分的测试去保证它的稳定性。

    记者:将来的解耦合有没有可能把整个存储都打散了?

    廖恒:目前我们所说的概念,其实从物理上已经把存储分散化了,因为服务器里头已经没有存储了。为什么我们还要从服务器看出去还是一台一台设备呢?因为这不需要应用改动。你可以想象一下如果你是百度或者阿里,淘宝的IT部门,要去说服天猫的人把它的软件重新写一遍,这首先会影响到它的业务,其次,可靠性、故障率的管理等各个方面都会带来一系列的问题。所以,从软件的角度看出去,它还是希望看见一台一台独立的机器。

    记者:有没有可能干脆有一个节点是做类似的存储控制器的工作,底下全都是存储?

    廖恒:这个其实就又回到传统的盘阵企业级存储,这种集中控制,包括对这个控制进行优化,存储系统厂商都下了很多功夫去做,但是从理念上来说,它其实和阿里、就是和几乎所有互联网数据中心用户的诉求相悖。

    记者:发布这些产品是针对互联网数据中心市场和ODM,那是否会跟其他的OEM合作?

    廖恒:回到中国的现实来讲,其实现在中国互联网公司的采购途径其实还是所谓标准服务器的OEM厂家,虽然这些厂家为它定制了服务器,比如华为,浪潮,联想等。

    记者:解耦合有没有可能扩展到集群?

    廖恒:目前考虑的还是在机柜内的,除了成本的考量外,还有个非常关键的因素——距离。这是直接影响协议的,比如要设计一个能够覆盖一公里的组网协议,一定会有相应的、不管从物理层到链路层等一系列的问题,这就会使得这个技术每端口成本提升到另外一个量级。

  所以,今天所讨论的解耦合形成的资源池,确实不是一个终极的资源池。如果要把整个数据中心,10万台服务器全部组成一个大资源池,这种理想很美,但就目前的技术而言,互联带宽一定是问题。这也是为什么会有分级的这种概念,就是说你不可能把它全部扁平化,否则付出的代价太高。

  英特尔一直在推硅光技术的发展,我们其实也非常关注这个领域。 如果有一种新的技术,能够把传输成本降得非常低,那数据中心整体资源的扁平化可能就会实现,但是在那天到来之前大家还是受到这个线的限制。

    记者:您提到的SAS Switch解耦合,让我想起了FC,两者有何优劣?

    廖恒:PMC也做FC芯片,从基础技术的角度来说,SAS、FC并没有什么本质差别。换言之,  如果单从逻辑的角度来看,没有什么理由说FC非得要比SAS贵。但FC的价格其实完全是由产业规模所决定的。因为在定义某一个技术时,如果这个技术的开发完全是针对某一种市场,那就决定了它能卖多少,如果研发出来的器件一年销售量只能是有限的个数,那必然会导致单价较高。SAS技术和FC的差别是其介入了通用服务器后端的整个市场,所以它的市场总量有一个比较大的基数,这个基数使得它的成本得到了优化。如果我们把它应用在一个跟FC很类似的领域里,SAS就具有明显的成本优势。

    记者:和互联网用户沟通中,他们对解耦合部署感兴趣的话,主要是因为什么?

    廖恒:大部分用户会觉得这样的解耦合方案可以解决刚才讲的那种非常多种机型要去定制的问题,比如说任何一家可能都有五六种不同的机型或更多种类,导致的结果是,从供应链的角度来说,首先要定制这么多种类型,每一种类型都要投标。其中有很多机型其实是不怎么盈利的,因为它的采购量很小。你要去说服厂家为你做这样的东西,人家可能不愿意,谁也不愿意长期在一个不盈利的领域去提供产品,或是持续研发。另外,这么多种类的服务器,每一种要去测试、存货、备货,还要有备件,这一系列都需要成本。如果能把这些种类汇聚成两种机型,一个高配的CPU,一个低配的CPU,而且机械尺寸也是从大大小小的各种尺寸变成相对固定的尺寸,那就已经是很大的优化。

    记者:上次新浪的那个人讲要定制服务器,说服厂商真的是很难。

    廖恒:其实,我们今天看到很多演讲也是有同样的观察。中国这个行业是非常生机勃勃的,大家都比较有进取心。在这种前提下,都会有一个很终极的愿望,就是要去定制服务器,做最符合我的诉求的东西。但是很少人会跨越行业去考虑到我的供应商怎么看这个问题,供应商的上家芯片厂家怎么看这个问题。即便是去加工一个特殊的盒子,光是开模做铁壳就要花很多钱,如果采购量非常少,供应商肯定是不太情愿的。所以,最终用户所需要的东西,不一定能够和他的供应商的利益长期吻合,这就导致了你刚才讲的这种困惑。

    记者:最近的天蝎标准2.0,对供应商的影响是什么?

    廖恒:大家所看到的这个互联网市场是一个高增长市场,很多尤其是国内比较有实力的厂家都在做一些战略性的投入,要去占地盘,想在这个高速增长的市场里头占有市场份额,然后,当这个市场份额建立之后,客户关系建立了之后,再做长远的打算,继续再往前看。

  但是,如果看看他们的战略投资,很难说在定制的过程中每一个产品能否最好地盈利。但是,这么一种生态环境,战略投资是可以做几年的,但不可能永远这样下去,必须要建立一个相对健康的环境才能够持续发展。

  现在看到的定制化,比如天蝎,主要还是在机械尺寸、IMC等方面做一些整合,对于节点的实现方式还有很多灵活性,并没有非常明确和单一的规范。

    记者:SAS Switch解耦合方案如果做好了应该最终会冲击普通企业级市场?

    廖恒:是的,我们也有这样的期望。尤其是看企业市场里,发货量最大的那种所谓的入门级存储系统和入门级SAN,其实规模也是相当小的,8-10台服务器,几个小的盘阵,甚至是一体的。这种技术它带来的可能性是把这些产品的成本一下就拉低一个数量级。

    记者:SAS Switch解耦合方案在企业级市场的推广阻力是什么?

    廖恒:在企业级市场, 比如说刚才讲的存储服务器,这些设备厂商还是下了多年的功夫,产品要非常可靠,而且要有比较完善的管理,还要训练你的分销商去推广这个东西,培训IT人员去管理这个设备,这一系列其实都是OEM所擅长的。因为他们不光是从技术、从销售渠道、从物流各个方面都建立了一整套体系去服务这样的客户,而且这个客户(刚才讲到多是中小企业)又是分布在全球各地。所以我说的阻力其实是很现实的,把一个产品输送到最终用户有一定的距离,我们需要合作伙伴可以把这样的技术带给这些用户。尽管这个方案和VMware的vSAN非常类似,但是我们要做到同样的程度,也还有非常漫长的路要走。因为VMware在企业市场已经广泛被采用了,有销售渠道、服务网络等,而且就软件而言, 对用户来说只是更新版本的问题,但是要卖一台全新的设备就是不一样的事情。

    记者:我觉得像BAT,包括国外互联网公司其实对上游厂商控制力比较强,如果你们跟他们合作,如果这些互联网用户真正感兴趣,他们应该能够反向控制ODM厂商。

    廖恒:是,互联网公司相对来说还是比较容易切入的市场,因为它很集中,全世界就20个互联网公司,希望只要跟20个人去解释一件事情,而不要跟几十万个用户去解释。

    记者:PMC作为芯片和方案厂商,如果不做成生态圈的话,怎么向市场推呢?

    廖恒:首先从体量上来说,我们可能只是一个蚂蚁或者细菌,而这些知名的OEM、数据中心用户则是大象;从硬件生态圈来看,虽然我们非常小,但至少在今天来说所有的东西都还要靠芯片来实现,所以可能产生四两拨千斤的效果。我们很小,声量也很小,只能去找合适的、有足够能力的伙伴,不管是最终用户还是OEM的合作伙伴也好,借助他们的市场推广能力把一些新技术引入到生态圈。 虽然这样做确实是比较吃力,但是我们一直在做这样的尝试。比如说VMware或者EMC要发布一个新技术,它对全球的推动力远远大得多,而且效果是立竿见影的。 我们做的事情通常都比较间接,我们做一个芯片要几年才能够放到系统里头,再通过评测周期,才能进到最终用户。

    记者:推这套架构,对PMC在盈利上会带来哪些增长?

    廖恒:我们是在进行开拓性的探索。过去,我们作为芯片和方案厂商,直接和OEM伙伴合作是非常简单的盈利模式,而且也使我们可以非常集中,无需关心最终用户的应用需求,因为那些OEM都已经把它整合起来了,把它规范成某一种产品的规范,而我们只要去满足这个OEM的规范,他们自然会将其推向市场去适配各种种类的应用。

  但是,过去三五年间,你会看到OEM大大弱化,这是由于所谓云计算和互联网带来的冲击,就是说产业形态发生变化之后,OEM对系统产品的技术把握已经越来越弱了,甚至是失去了控制。 比如说服务器市场,过去只是三家,三分天下大概就已经占了90%,但现在出现了新的segment——数据中心的定制化服务器,每年在急速增长,它的规模目前确实还没有工业标准服务器的规模大,但这是一个快速增长的领域,而标准服务器又是相对萎缩的一个领域。

  在这种情况下,我们不得不去适应这个形势。对定制化服务器的掌握权、话语权,其实是在这些互联网公司,而他们又不是只有一种声音,Google有自己的标准,Facebook有Open Compute,中国有天蝎,而且BAT三家等等都有自己的各种规范……当市场细分下来,你会发现芯片厂家其实处境艰难,因为它的总量不够大,还要进行进一步细分。所以我们只能说在这个过程当中努力地去适应这个环境,要学会怎么样为互联网这个市场找到一种不管是商业模式也好、技术模式也好,或是合作的模式,来服务这个市场,从而找到生存的空间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值