AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
CMT in TREC-COVID Round 2: Mitigating the Generalization Gaps from Web to Special Domain Search
论文链接:https://www.aminer.cn/pub/5fa2837491e011cda13f4f49
推荐理由: 本文作者来自清华大学团队,作者提出了MetaAdaptRank算法进一步解决面向少样本场景下的信息检索问题。MetaAdaptRank采用了对比学习的方法生成了问题-文档相关性数据,进一步通过元学习的方式对弱监督数据进行加权,并训练神经信息检索模型。相关模型在面向医学领域的信息检索场景TREC COVID评测的第二轮无人工干预组中获得第一名的成绩,同时被微软面向医学领域的搜索引擎所应用。
ICLR 2021 论文推荐
Geometry-aware Instance-reweighted Adversarial Training
论文链接:https://www.aminer.cn/pub/5f7c477591e0117ac2a78a81/?conf=iclr2021
推荐理由: 本文入选ICLR 2021 oral。在对抗式机器学习中,人们普遍认为鲁棒性和准确性会互相制约。最近的研究对这一信念提出了挑战,即能够在保持鲁棒性的同时提高准确性。然而,是否可以在提高鲁棒性的同时保持准确性是一个更有趣的问题。在本文中,作者认为上述方向极具前景。首先,该工作发现即使是超参数化的深度网络也可能仍然存在模型容量不足的问题,原因在于对抗性训练具有压倒性的平滑效果。其次,在模型容量有限的情况下,对抗性数据的重要性应该是不对等的:从几何学上讲,离类边界越近/越远的自然数据点的鲁棒性越小/越强,相应的对抗性数据点应该分配较大/较小的权重。为了实现这一思想,作者提出了几何感知实例加权的对抗性训练。实验表明,该方法提升了标准对抗式训练的鲁棒性。
On the mapping between Hopfield networks and Restricted Boltzmann Machines
论文链接:https://www.aminer.cn/pub/600832769e795ed227f5310b/?conf=iclr2021
推荐理由: 本文入选ICLR 2021 oral。霍普菲尔德网络(HNs)和受限玻尔兹曼机(RBMs)是统计物理学、机器学习和神经科学中的两个重要模型。近期,由于它们在统计力学形式论下的相似性,人们对HNs和RBMs之间的关系产生了兴趣。作者在本文中提出了相关模式HNs在一般情况下的精确映射,它能够更广泛地适用于现有数据集。具体来说,作者表明,任何具有N个二进制变量和p<N个潜在相关的二进制模式的HN都可以转化为具有N个二进制可见变量和p个高斯隐藏变量的RBM。该工作概述了反向映射存在的条件,并在MNIST数据集上进行了实验,表明了映射为RBM权重提供了有用的初始化。作者讨论了扩展这种对应关系对于RBMs训练的潜在重要性,以及对于理解利用RBMs的特征提取方法的性能。
Getting a CLUE: A Method for Explaining Uncertainty Estimates
论文链接:https://www.aminer.cn/pub/5ee7495191e01198a507f804/?conf=iclr2021
推荐理由: 不确定性估计和可解释性都是可信的机器学习系统中的重要因素。然而,在这两个领域的交叉点上的工作很少。作者通过提出一种新的方法来解释来自可区分概率模型(如贝叶斯神经网络(BNNs))的不确定性估计来解决这一差距。该工作的方法,Counterfactual Latent Uncertainty Explanations (CLUE),指出了如何通过改变一个输入,使保持它在数据组上,从而让BNN对输入的预测更有信心。作者通过1)评估不确定性的反事实解释的新框架,2)一系列消融实验,3)用户研究来验证CLUE。实验表明,CLUE的性能优于基线,使从业者能够更好地理解哪些输入模式是预测不确定性的原因。
AMiner,一个具有认知智能的学术搜索引擎:https://www.aminer.cn/
#AMiner# #论文#