【论文推荐】 2021-11-10 云间周报 | 十月初六 | 星期三 | 今日宜运动

本文推荐了多篇近期的科研论文,涉及自然语言处理、计算机视觉、机器学习等领域。重点介绍了NLP-Fast系统,用于加速大规模NLP模型,以及PrecisionBatching算法,提升低批处理量神经网络在GPU上的推理速度。同时,还探讨了视觉功能可供性如何帮助机器人学习新技能,以及用于多机器人协同导航的视觉运动强化学习方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

点击链接阅读原文:https://mp.weixin.qq.com/s/-zhWzy4tqMdYdOo88JHJug


# 01 自然语言处理:
  • “NLP-Fast: A Fast, Scalable, and Flexible System to Accelerate Large-Scale Heterogeneous NLP Models”

译:NLP-Fast: 一个用于加速大规模异构NLP模型的快速、可扩展、灵活的系统
简介:现有的NLP模型中不能提供足够的可扩展性和灵活性,因为它们既没有识别也没有优化最近的NLP模型中出现的广泛的性能关键操作,而只是专注于优化特定操作。因此,本文提出了NLP-Fast,一个以加速广泛的大规模NLP模型的系统解决方案。NLP-Fast主要由两部分组成。(1) NLP-Perf:一个深入的性能分析工具,用于识别新兴NLP模型中的关键操作;(2) NLP-Opt:三种端到端的优化技术,用于加速各种硬件平台(如CPU、GPU、FPGA)上识别的性能关键操作。NLP-Fast可以在不同的硬件平台上加速各种类型的NLP模型,通过NLP-Perf识别其关键操作并应用NLP-Opt的整体优化。在CPU、GPU和FPGA上评估了NLP-Fast,总体吞吐量比每个平台的基线最多可提高2.92倍、1.59倍和4.47倍。
发表于:International Conference on Parallel Architectures and Compilation Techniques(PACT)
等级:CCF: B
原文链接:https://ieeexplore.ieee.org/document/9563012
日期:2021.10.18

  • “Precision Batching: Bitserial Decomposition for Efficient Neural Network Inference on GPUs”

译:精确合批:用于GPU上高效的神经网络推理的比特序列分解
简介:基于以下三个观点:1)传统硬件架构(如:GPU)上的低批处理量的神经网络推理是有内存限制的,2)激活精度对提高量化模型的质量至关重要,3)矩阵-向量乘法可以分解为二进制矩阵-矩阵乘法,以更多的算术运算为代价,实现更高精度的激活的量化推理。本文提出了PrecisionBatching,这是一种量化的推理算法,用于在低位宽的传统硬件平台上加快神经网络推理的速度。通过将内存约束问题转变为计算约束问题,实现了极端量化水平(<8比特)的推理,并在固定精度阈值下与标准量化推理方法相比实现了更高的计算效率和运行时速度。在各种应用(MNIST、语言建模、自然语言推理、强化学习)和神经网络架构(全连接、RNN、LSTM)中,PrecisionBatching在全精度基线<1-5%的误差范围内,在GPU上获得了超过8倍的端到端加速,在相同的误差容限下,比传统的8位量化推理要好1.5 × - 2倍。
发表于:International Conference on Parallel Architectures and Compilation Techniques(PACT)
等级:CCF: B
原文链接:https://ieeexplore.ieee.org/document/9563027
日期:2021.10.18

  • “What Can I Do Here? Learning New Skills by Imagining Visual Affordances”

译:我可以在这里做什么?通过想象视觉功能可供性来学习新技能
简介:一个配备了所学技能的通用机器人必须能够在许多不同的环境中执行许多任务,但遇到一个新的环境或物体时,它可能需要对其先前学到的一些技能进行微调,以适应这种变化。但是以前学过的行为和模型仍应适合加速这种再学习。本文旨在研究可能结果的生成模型如何能让机器人学习功能可供性的视觉表征,从而使机器人能够在新的情况下对潜在的可能结果进行采样,然后进一步训练其策略以实现这些结果。实际上,先前的数据被用来学习什么样的结果是可能的,这样,当机器人遇到一个不熟悉的环境时,它可以从其模型中抽取潜在的结果,尝试达到这些结果,从而更新其技能和结果模型。这种方法可用于训练以原始图像输入为基础的目标条件策略,并可通过我们提出的以功能可供性为导向的探索方案迅速学会操纵新物体。
发表于:IEEE International Conference on Robotics and Automation(ICRA)
等级:CCF: B
原文链接:https://ieeexplore.ieee.org/document/9561692
日期:2021.10.18


02 计算机视觉:

  • “Visuomotor Reinforcement Learning for Multirobot Cooperative Navigation”

译:用于多机器人协同导航的视觉运动强化学习
简介:本文研究了基于原始视觉观察的多机器人协同导航问题。提出了一个完全端到端的学习框架,它利用图神经网络来学习局部运动协调,并利用深度强化学习来产生视觉运动策略,使每个机器人能够在不需要环境地图和全球定位信息的情况下移动到其目标。实验结果表明,在有几十个机器人的情况下,该方法与基于模仿学习的方法在鸟瞰状态输入方面取得了相当的性能,同时,具有对于拥挤和大环境的通用性以及对训练机器人数量的十倍的可扩展性。另外,该模型也能提高在未知环境中单机器人导航任务的成功率。
发表于:IEEE Transactions on Automation Science and Engineering(TASAE)
等级:CCF: B; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9555922
日期:2021.10.01

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值