MICRO 2017会议概况
会议简介
The International Symposium on Microarchitecture (MICRO),国际微架构研讨会(MICRO),是介绍和讨论微体系结构、编译器、硬件/软件接口以及高级计算和通信系统设计的主要论坛。MICRO的目标是将微体系结构、编译器和系统领域的研究人员聚集在一起进行技术交流。
主题:
1)处理器、内存、互连和存储体系结构。
2)硬件、软件和混合技术,用于提高系统性能、能源效率、成本、复杂性、可预测性、服务质量、可靠性、可靠性、安全性、可伸缩性、程序员生产率等。
3)指令级、线程级和内存级并行的体系结构:超标量、VLIW、数据并行、多线程、多核、多核等。
4)低功耗、高性能和成本/复杂度高效的体系结构。面向新兴平台的架构,包括智能手机、云/数据中心等。嵌入式处理器、dsp、gpu、ASIPs(网络处理器、多媒体、无线、深度学习、神经形态等)的架构和编译器。高级软件/硬件猜测和预测方案。
5)更好地支持系统软件、编程语言、可编程性和编译的微体系结构技术。微体系结构建模和仿真方法。
6)对现有的微架构、硬件/软件机制和工作负载进行深入的实验和比较评估和分析。
会议概况
名称:The 50th Annual IEEE/ACM International Symposium on Microarchitecture
时间:2017年10月14日—2017年10月18日
地点:Boston
论文概况:
共接收投稿326篇,收入61篇(录取率18.7%)。其中,内存相关工作无论是投稿量还是收录量,依然稳居第一。主要关注于DRAM和持久性内存。
在加速器工作上,GPU获得了大量的关注。
神经网络加速器工作依然有较高热度(4篇文章,其中包含一篇最佳论文提名文章),还有一个专门的讨论。周二的主题演讲来自微软的Doug Burger,也展示了该公司如何大规模使用FPGA硬件来加速深度学习。加速器和内存系统的趋势在the “In/Near Memory Computing” (“内/近内存计算”)讨论中融合在一起,其中包括一篇关于Oracle现在已经取消的RAPID项目的论文,该项目在内存控制器中构建了近内存加速器。
专用加速器结构的研究热度有增无减(论文提交列位第三),包含了对数据解析,语音识别,图像去噪,非线性差分方程求解等不同应用。
量子计算得到了大量关注,本次会议收录了3篇相关文章,其中包括一篇最佳论文。
本届MICRO除了量子计算,还有一些让人耳目一新的工作,比如针对基于环保可降解材料的电路的架构设计,以及作为最佳论文提名之一的研究处理器设计对移动设备电磁干扰的影响。
ARM的技术副总裁Krisztian Flautner在开幕式上发表了题为“To a Trillion and Beyond: the Future of the Internet of Things”的主题演讲。他的演讲讨论了数据的重要性和获得可靠系统的困难。物联网设备收集的数据是一种很有价值的资源,所以公司倾向于将其储存起来,即使如果它们共享的话,社会可能会更好。例如,要实现可靠的自动驾驶汽车需要1万亿英里的行驶里程,单个汽车制造商可能很难或不可能积累足够的经验。但如果汽车制造商能分享经验,安全的自动驾驶汽车就能更快实现。主题演讲的第二部分讨论了如何通过稳定、治理和透明来实现信任。人类有一种基于表面特征(如面部特征)的信任倾向。对于像自动驾驶汽车这样需要高度信任的系统,我们必须在避免人类偏见的同时,在几个方面努力实现这一点。
微软杰出工程师道格•伯格(Doug Burger)就“Specialization and Accelerated AI at Hyperscale“(特色化和超级大规模人工智能加速)发表了主题演讲。他描述了微软使用FPGAs在生产数据中心内支持大规模流计算的工作。考虑到在微软的Azure公共云中运行的代码的质量和广度,可重新配置的硬件是支持广泛的用例和允许开发人员逐渐“硬化”(例如:,将软件移植到FPGA实现)其应用程序的部分。Burger分享了Catapult平台的历史,首先向Bing服务器添加了fpga,以加速网络搜索。他们目前的设计是将FPGA与高速网卡相结合,并允许FPGA处理所有进出服务器的流量。有了这种网络内可编程硬件,就有可能在fpga上运行整个微服务,完全与传统服务器分离。这反过来又帮助微软的脑波项目实现了高性能的深度学习。通过脑波,fpga作为硬件微服务提供了深度神经网络推理的关键组件,允许非常低的延迟。由于有可编程硬件,诸如降低精度数据类型之类的优化实现起来非常自然。Burger强调了系统级设计的重要性:可重新配置的硬件导致了新的数据中心组织。这些创新中有许多是在“子领域之间的裂缝”中工作的结果,例如架构与安全、网络或分布式系统之间的裂缝。
奖项:
名人堂(8篇及以上MICRO文章):Bill Dally, Chita Das, Reetuparna Das, Daniel Jiménez, Aamer Jaleel and Yuan Xie
B.Ramakrishna (Bob) Rau Award:高光荣教授凭借对数据流编译器(dataflow compiler)的研究,。在指令级和线程级并行计算的编译技术和微体系结构上的贡献,荣获了B.Ramakrishna Rau大奖
The MICRO Test-of-Time Award:Mikko Lipasti and John Shen,《Exceeding the Dataflow Limit via Value Prediction》from MICRO-29 in 1996.
最佳论文(提名):
1)《An Experimental Microarchitecture for a Superconducting Quantum Processor》
(超导量子计算机中的一种实验性微架构)
2)《Hardware Supported Persistent Object Address Translation》
(硬件支持的持久性对象地址转换)
3)《DelftNN: Addressing Bottlenecks for DNN Execution on GPUs via Synapse Vector Elimination and Near-compute Data Fission》
(DelftNN:通过突触向量消除和近计算数据分解,解决GPU上深度神经网络运行的瓶颈)
4)《Architectural opportunities for novel dynamic EMI shifting (DEMIS)》
(动态电磁干扰转换中的架构因素)