AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
IJCAI 2020 论文推荐
Polar Relative Positional Encoding for Video-Language Segmentation
论文链接:https://www.aminer.cn/pub/5ef96b048806af6ef277204d/?conf=ijcai2020
推荐理由:在本文中,作者解决了一个名为视频语言分割的任务。该任务给定一段视频和一个自然语言的句子,目标是分割视频帧中该句子所描述的对象或行为者。本文提出了一种新型的极地相对位置编码(Polar Relative Positional Encoding,PRPE)机制,以 "语言 "的方式表示空间关系,即利用方向和范围。句子特征可以以更直接的方式与位置嵌入交互,提取隐含的相对位置关系。同,该研究还提出了针对这些位置嵌入的参数化函数,以适应实值方向和范围。通过PRPE,作者设计了一个极地注意力模块(Polar Attention Module,PAM)作为视觉-语言融合的基本模块。在具有挑战性的A2D句子数据集上,上述方法在mAP方面以11.4%的绝对改进幅度优于之前的最佳方法。
Memory Augmented Neural Model for Incremental Session-based Recommendation
论文链接:https://www.aminer.cn/pub/5eb7896cda5629cf2443076e/?conf=ijcai2020
推荐理由:对隐私的日益关注激发了人们对仅使用当前浏览器会话中观察到的数据的会话推荐(Session-based Recommendation,SR)的兴趣。现有方法多在静态环境中评估,为更好地解决SR任务的动态性质,作者研究了一个增量SR场景,其中新的项目和偏好不断出现。该工作表明,现有的神经推荐器可以在增量SR场景中使用小的增量更新,以减轻计算开销和灾难性遗忘。同时,作者提出了一个名为记忆增强神经模型(Memory Augmented Neural model,MAN)的通用框架。MAN用一个持续查询和更新的非参数存储器来增强基础神经推荐器,神经和存储器组件的预测。作者实验表明,MAN非常适合增量SR任务,它的性能始终优于最先进的神经和非参数方法。
AAAI 2021 论文推荐
Constrained Risk-Averse Markov Decision Processes
论文链接: https://www.aminer.cn/pub/5fcdfb9091e01124d5ec3e87/?conf=aaai2021
推荐理由:作者考虑为具有动态一致性风险目标和约束的马尔科夫决策过程(Markov decision processes,MDPs)设计政策的问题。该研究首先在一个拉格朗日框架中表述上述问题。在假设风险目标和约束可以用马尔科夫风险过渡映射来表示的情况下,作者提出了一种基于优化的方法来综合降低约束风险规避问题的马尔科夫策略。作者证明了所制定的优化问题是差分凸程序(difference convex programs,DCP)的形式,并且可以通过有纪律的凸凹编程(disciplined convex-concave programming,DCCP)框架来解决。该工作表明,这些结果概括了具有总折现预期成本和约束的约束MDPs的线性程序。最后,作者通过对涉及条件风险值(conditional-value-at-risk,CVaR)和熵风险值(EVaR,entropic-value-at-risk)相干风险度量的漫游车导航问题的数值实验说明了提出方法的有效性。
Gaussian Process Priors for View-Aware Inference
论文链接: https://www.aminer.cn/pub/5dee1b4b3a55ac3d409addde/?conf=aaai2021
推荐理由:作者提出了一个原则性框架,用于编码单个场景的视图或摄像机姿势之间的信息耦合的先验知识。虽然深度神经网络已经成为计算机视觉中许多任务的优秀解决方案,但一些不太适合深度模型的重要问题却没有得到足够重视。上述问题包括不确定性量化、辅助数据融合和实时处理,它们对于提供具有鲁棒推理的实用方法至关重要。为此,作者在姿势空间中推导出一个新的参数核(协方差函数),将输入姿势关系的信息编码到更大的模型中。该工作证明了这种软优先知识能够提高几个真实视觉任务的性能,如特征跟踪、人脸编码和视图合成。
ICLR 2021
How Neural Networks Extrapolate: From Feedforward to Graph Neural Networks
论文链接: https://www.aminer.cn/pub/5f6dc84991e01153370055fc/?conf=iclr2021
推荐理由:作者研究通过梯度下降训练的神经网络如何外推,即它们如何在训练分布的支持之外学习到的东西。以往的工作报告了用神经网络进行外推时的混合经验结果:多层感知器(multilayer perceptrons,MLPs)在简单的任务中不能很好地外推,而具有MLP模块的结构化图神经网络(Graph Neural Networks,GNNs)在更复杂的任务中取得了一些成功。作者提供了一个理论解释,并确定了MLPs和GNNs推断良好的条件。该工作首先展示了通过梯度下降训练的ReLU MLPs沿着从原点出发的任何方向快速收敛到线性函数,这表明ReLU MLPs在大多数非线性任务中不能很好地外推。另一方面,当训练分布足够 "多样化 "时,ReLU MLPs可以被证明收敛到线性目标函数。这些观察结果促成了一个假设,即如果在架构和输入表示中编码适当的非线性,GNNs可以在动态编程(dynamic programming, DP)任务中很好地外推。
Learning Cross-Domain Correspondence for Control with Dynamics Cycle-Consistency
论文链接: https://www.aminer.cn/pub/5fdc954991e01104c9181218/?conf=iclr2021
推荐理由:许多机器人问题的核心挑战是学习跨领域对应关系。例如,模仿学习( imitation learning)需要获得人类和机器人之间的对应关系;模拟到真实(sim-to-real)需要物理模拟器和真实世界之间的对应关系;转移学习(transfer learning)需要不同机器人环境之间的对应关系。本文旨在学习不同表征(视觉与内部状态)、物理参数(质量和摩擦力)和形态(肢体数量)的领域之间的对应关系。其中的重点是使用来自两个领域的未配对和随机收集的数据来学习对应关系。作者提出了使用周期一致性约束来对齐两个领域的动态机器人行为的动态周期。一旦找到对应关系,便可以直接将在一个域上训练的策略转移到另一个域,而不需要在第二个域上进行任何额外的微调。该框架能够在没有配对数据的情况下,将真实机器人手臂的未校准单眼视频与模拟手臂的动态状态动作轨迹进行对齐。
订阅了解更多论文信息,定制您的个人科研动态信息流:https://www.aminer.cn/user/notification?f=mt