向上扩展或向外扩展?还是两者兼顾?​

随着新一代CUDA GPU的发展,小规模CPU-GPU集群相比传统Hadoop CPU集群,在成本和能耗大幅降低的同时,实现了数百倍的性能提升。该技术使小型企业也能进行高效的大数据分析。通过将数据节点扩展为具备强大计算能力的胖节点,可以进一步提高分析效率。

在过去的20年里,IT行业的主要趋势是向外扩展。​从大型机到Unix和/或Windows服务器组成的网络,再到Google发明并由Apache Hadoop改进的MapReduce系统​,向外扩展的方式证明了它的价值。但最近在LinkedIn Hadoop用户组(需要成员资格)里有一个有趣的讨论,​内容是针对使用MapReduce和胖节点(Fat Node)的“大数据”分析,向上扩展GPU。

\

这个讨论是由Suleiman Shehu发起的,​延续了他5个月前的一篇博文的内容,​文中提到:​

\
过去的两年里​,​包含1000个​普通CPU的大集群,运行着Hadoop MapReduce,驱动着涉及成百TB信息的“大数据”的分析处理​。​现在,新一代的CUDA GPU​创造了潜在的“大数据”分析的颠覆性技术​,使用更小的混合CPU-GPU集群。相比传统的运行Hadoop MapReduce的CPU集群,​这些小型-中型的混合CPU-GPU集群只需1/10的硬件成本、1/20的电力消耗就可以获得500x甚至更快的速度。​这项颠覆性的技术进步​让小公司和组织能和那些可以负担非常大的Hadoop CPU集群来分析“大数据”​的公司进行竞争。​
\

考虑到能节省大量成本,并获得重大性能提升,Shehu的主要问题是:​

\
有了Hadoop MapReduce,我们是否可以发挥最新一代的Fermi GPU的并行处理能力​,结合MapReduce模型的简单性,创造出更小的,可以负担得起的CPU-GPU集群,用于实时“大数据”​分析?​
\

在他的博客中,Shehu断言实现此类集群最合适​的方法是把数据节点向上扩展成胖节点。​他提出胖节点的作用是把尽可能多的处理​放在本地节点上,这些节点的架构设计特性如下:​

\
\
  • 使用双12核CPU,每个CPU用64GB或更多RAM,每个节点24 CPU核心和124GB RAM。\
  • 为双CPU连接10个或更多GPU,提供4,800 GPU处理核心,每个节点可以提供超过10 TFLOPS的处理能力。\
  • 用高速固态驱动器替换本地硬盘,每个使用PCI Express的SSD都有200K IOPS或更高吞吐量。在单个节点上,多个SSD可以组合在一起并行运行,达到超过220万IOPS的吞吐量。\
  • 节点之间的网络使用40Gb/s的InfiniBand网络连接。结合传输速度达到每秒90M MPI消息、跨PCIe双总线的网络连接到其他节点,完全可以达到一个大型Hadoop集群的消息传输能力。\
\

基于此,Shehu认为:​

\
设计一个能发挥如今GPU技术​的MapReduce变体,可以​显著降低“大数据”分析的前期集群构造和能源消耗成本,与此同时还能利用MapReduce模型降低软件开发的成本。​
\

尽管从技术上来讲这个MapReduce实现可以提升整个集群的性能,但讨论的一个参与者Vladimir Rodionov提出了关于此类集群的数据容量问题。传统Hadoop集群的优势之一是可以存储上PB的数据,而较小的“胖节点”​集群要求每个节点有更多带独立控制器的磁盘存储​,这会抬高集群的​价格。​

\

Gerrit Jansen van Vuuren的另一个评论也持有相同观点:​

\
.... Hadoop的设计不是针对处理器密集型任务的,而是数据密集型任务——“大数据”​。...无论你的RAM、CPU/GPU有多快,你还是要从磁盘、SSD或其他存储中读取那么多字节。...也许能更好地运行在这种面向计算的平台​上的软件框架是与Grid Gain类似的东西。​
\

Shehu答复了这些评论:​

\
... 有很多Hadoop用户目前正在使用Hadoop来进行上TB数据的分析处理​,他们也把自己的数据定义为“大数据”​。所以说这个术语​并非一成不变的。​因为Hadoop不是设计来执行分析处理的,​所以我们有不少MapReduce变体​,例如Twister Iterative MapReduce、Hadoop++等等,它们更关注于运行分析类M/R查询。我相信这是M/R GPU集群最初的领域。​
\

Hadoop集群中使用的普通服务器的定义正在快速改变。两三年前的高端服务器​现在就很普通。因此,今天的集群正获得越来越多的计算能力。无论我们是否意识到了,map-reduce计算变得更快了。​真正的问题是我们是否可以两者兼得——在单个集群中有​大数据存储和执行计算密集型任务(利用特定硬件)​而不会耗尽资源,或者我们真的需要开始分别对待这两个问题​,定义两种不同的方法。

\

阅读英文原文:​Scale-up or Scale-out? Or both?

【SCI一区复现】基于配电网韧性提升的应急移动电源预配置动态调度(下)—MPS动态调度(Matlab代码实现)内容概要:本文档围绕“基于配电网韧性提升的应急移动电源预配置动态调度”主题,重点介绍MPS(Mobile Power Sources)动态调度的Matlab代码实现,是SCI一区论文复现的技术资料。内容涵盖在灾害故障等极端场景下,如何通过优化算法对应急移动电源进行科学调度,以提升配电网在突发事件中的恢复能力与供电可靠性。文档强调采用先进的智能优化算法进行建模求解,并结合IEEE标准测试系统(如IEEE33节点)进行仿真验证,具有较强的学术前沿性工程应用价值。; 适合人群:具备电力系统基础知识Matlab编程能力,从事电力系统优化、配电网韧性、应急电源调度等相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①用于复现高水平期刊(SCI一区、IEEE顶刊)中关于配电网韧性与移动电源调度的研究成果;②支撑科研项目中的模型构建与算法开发,提升配电网在故障后的快速恢复能力;③为电力系统应急调度策略提供仿真工具与技术参考。; 阅读建议:建议结合前篇“MPS预配置”内容系统学习,重点关注动态调度模型的数学建模、目标函数设计与Matlab代码实现细节,建议配合YALMIP等优化工具包进行仿真实验,并参考文中提供的网盘资源获取完整代码与数据。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值