AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
ISCA论文推荐
RANA: Towards Efficient Neural Acceleration with Refresh-Optimized Embedded DRAM(RANA:通过刷新优化的嵌入式DRAM实现高效的神经网络加速)
论文链接:https://www.aminer.cn/pub/5b67b47917c44aac1c8635b4
推荐理由: 具有比SRAM高的密度的嵌入式DRAM(eDRAM)可用于提高片上缓冲区容量并减少片外访问。但是,eDRAM需要定期刷新以保持数据保留,这会消耗大量能量。如果eDRAM中数据的生存期短于eDRAM的保留时间,则无需刷新。基于此原理,作者为CNN加速器提出了一种保留感知神经网络加速(RANA)框架,以通过刷新优化的eDRAM节省总系统能耗。RANA框架包括三级技术:保留意识训练方法,混合计算模式和刷新优化的eDRAM控制器。由于采用了RANA框架,因此可以去除99.7%的eDRAM刷新操作,而性能和精度损失可忽略不计。与传统的基于SRAM的CNN加速器相比,经过RANA增强的基于eDRAM的CNN加速器可以在相同的面积成本下节省41.7%的片外存储器访问和66.2%的系统能耗。





FLIN: Enabling Fairness and Enhancing Performance in Modern NVMe Solid State Drives(FLIN:在现代NVMe固态驱动器中实现公平并提高性能)
论文链接:https://www.aminer.cn/pub/5b67b47917c44aac1c8635c9
推荐理由: 现代固态驱动器(SSD)使用新的主机接口协议(例如NVMe)为应用程序提供对存储的快速访问。这些新协议利用了多队列SSD(MQ-SSD),其中SSD可直接访问应用程序级I / O请求队列。虽然消除了OS软件堆栈可以显着提高性能,但它引入了一个新问题:不公平。作者对真实MQ-SSD中的干扰进行了全面的分析,发现了四个主要的干扰源:(1)每个应用程序发送的请求的强度;(2)请求访问模式的差异;(3)读写比;(4)垃圾回收。为了减轻MQ-SSD中的不公平,文中提出了感知干扰的调度程序(FLIN)。FLIN在SSD控制器固件中完全实现,不需要任何新硬件,并且存储成本可忽略不计(<0.06%)。与最新的I / O调度程序相比,FLIN改善了各种企业和数据中心存储工作负载的公平性和性能,平均分别提高了70%和47%。





GANAX: A Unified MIMD-SIMD Acceleration for Generative Adversarial Networks(GANAX:用于生成对抗网络的统一MIMD-SIMD加速)
论文链接:https://www.aminer.cn/pub/5b67b47917c44aac1c8635d4
推荐理由: 作者提出了GANAX结构,实现了统一的MIMD-SIMD设计,该设计利用计算中的重复模式来创建在SIMD模式下同时执行的独特微程序。 MIMD和SIMD模式的交织以单个微程序操作的粒度执行。为了分摊MIMD执行的成本,作者将数据访问与GANAX中的数据处理分离。该设计将每个处理引擎分为访问微引擎和执行微引擎。所提出的体系结构将访问执行体系结构的概念扩展到每个单独操作数的最佳计算粒度。使用6种GAN模型进行的评估显示,与Eyeriss相比,平均速度提高了3.6倍,节能量达到了3.1倍,而不会损害传统卷积加速器的效率,这些改进仅增加了约7.8%的面积。





AMiner,AI赋能的学术搜索平台:https://www.aminer.cn/
#AMiner# #论文#

本文精选了三篇来自AMiner平台的高质量论文,涵盖高效神经网络加速、NVMe固态硬盘性能优化及生成对抗网络的统一加速设计。这些研究成果在提高系统能效、公平性和计算性能方面取得了显著成果。
2万+





