
AMiner
文章平均质量分 51
AMiner:AI科研助手
聚焦科研检索、阅读、分析、写作场景,以对话重构繁杂的科研流程,打造极简易用的科研工作流,让信息和知识有效链接和流动起来,为全球科研机构、学者和科技从业者做科研加速。
展开
-
Kimi k1.5技术报告,深度长思考
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。原创 2025-02-23 23:57:14 · 871 阅读 · 0 评论 -
微软Phi-4技术报告,合成数据占比40%,14B小模型数学击败GPT-4o
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。原创 2025-02-23 23:53:31 · 611 阅读 · 0 评论 -
【深度学习在智能机器人中的应用】论文合集推荐丨CMU新型机器人算法可操纵所有日常家具
机器人发展的趋势是人工智能化,深度学习是智能机器人的前沿技术,也是机器学习领域的新课题。原创 2022-06-09 12:01:37 · 1014 阅读 · 1 评论 -
IJCAI2022论文合集(持续更新中)
持续更新中原创 2022-06-07 09:41:59 · 1181 阅读 · 0 评论 -
KDD 2022论文合集(持续更新中)
持续更新中原创 2022-06-06 20:41:13 · 2610 阅读 · 0 评论 -
【深度神经网络】主题论文推荐
深度神经网络(Deep Neural Networks, 简称DNN)是深度学习的基础,是深度学习的一种框架。它是一种具备至少一个隐层的神经网络,与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。以下论文供大家参考学习:1.Universality of Deep Convolutional Neural Networks.本文研究展示了深度卷积神经网络(CNN)是通用的,这意味着当神经网络的深度足够大时,它可以用来将任何连.原创 2022-04-26 11:08:09 · 1139 阅读 · 0 评论 -
【自监督学习】主题论文推荐
自监督学习本质上是一种无监督学习的方法,通常会设置一个“Pretext tasks”,根据数据的一些特点,构造Pesdeo Labels来训练网络模型。通过自监督得到的模型,可以作为其他学习任务的预训练模型,为其提供更好的训练初始区域。以下论文供大家参考学习:1.Self-Supervised Visual Feature Learning With Deep Neural Networks: A Survey本文广泛回顾了基于深度学习的自监督图像或视频中的一般视觉特征学习方法,总结并列出了一组有希.原创 2022-04-21 14:47:18 · 338 阅读 · 0 评论 -
【悟道模型】主题论文推荐
悟道2.0参数量达到1.75万亿,创下全球最大预训练语言模型记录。"悟道"超大模型智能模型旨在打造数据和知识双轮驱动的认知智能,让机器能够像人一样思考,实现超越图灵测试的机器认知能力。以下论文供大家参考学习:1.BaGuaLu: Targeting Brain Scale Pretrained Models with over 37 Million Cores在HPC系统上部署AI应用还存在差距,需要基于特定硬件特性的应用和系统协同设计。为此,本文提出了BaGuaLu1,这是第一个在整个百亿亿次级超.原创 2022-04-18 17:22:59 · 1373 阅读 · 0 评论 -
【知识图谱推理】必读论文推荐
通俗的理解,所谓推理,就是从现有的知识出发,运用逻辑思维能力,得出一些隐性的结论。具体到知识图谱中,所谓的知识推理,就是利用图谱中现有的知识(三元组),得到一些新的实体间的关系或者实体的属性(三元组)。设想一下,假如机器推理做的完备,一方面,它能够帮我们填充知识图谱中大量的空缺,使得知识更为完备;另一方面,对于知识问答、推荐系统等任务也有非常大的加成。小编整理了以下几篇论文供大家参考:1.RNNLogic: Learning Logic Rules for Reasoning on Knowledge原创 2022-04-12 15:40:04 · 1147 阅读 · 0 评论 -
她力量系列八丨陈丹琦:我希望女生能够得到更多的机会,男生和女生之间的gap会逐渐不存在的
陈丹琦主页:https://www.aminer.cn/profile/danqi-chen/562ce7f545cedb3398cfa6d0文章转载丨叉院学姐作者:何婉榕、毛嘉怡、何婉榕、王世因陈丹琦Danqi Chen湖南长沙人。高中毕业于雅礼中学。第 20 届国际信息学奥林匹克竞赛(IOI2008)金牌得主。大学毕业于清华大学,08 级姚班校友。毕业后前往斯坦福大学攻读博士学位,毕业论文《Neural Reading Comprehension and Beyond》获得了斯坦福 Co.原创 2022-03-07 16:57:56 · 1145 阅读 · 0 评论 -
她力量系列七丨兰艳艳:理想温暖10年科研路,女性可以柔和,更要自信、专业 | 妇女节特辑
文章转载丨智源社区作者:Isabel、李梦佳导读:数学博士,在美国加州伯克利大学担任访问学者,还有近十年的中科院计算所研究员经历……见面前,我在脑中为兰艳艳描绘出了一幅“学术、忙碌、雷厉风行”的精英女科学家形象。但当长发的她,身穿着淡紫色的毛衣微笑地走进采访间时,我感受到了扑面而来的知性气息。“我觉得可能很多时候我们女性要自信一些。”她神采奕奕地说道。兰艳艳教授的采访,安排在一个2月末的下午。此时北京的气温已经开始回暖,和煦的午后阳光与智源大厦的红砖墙体相得益彰。关于女性科学家独特的风采,从与兰艳.原创 2022-03-07 16:55:02 · 880 阅读 · 0 评论 -
她力量系列六丨杨笛一:女孩长大后数理化可以很好,科研可以很鲜活
文章转载丨AI科技评论作者:陈彩娴导语:回想起以前读书的经历,研究NLP的杨笛一发现大家常说的两句话根本没有输出的意义:一是“等你们上了大学就轻松了”;二是“女生小时候成绩好,长大后数理化成绩就不会好了。”而这两句话,在她身上都是错误的。隔着13个小时的时差,坐落于美国东南部的亚特兰大应已接近深夜,我们的访谈也接近尾声。谈起当年的文理分科考试,杨笛一调皮又自信地说起自己文理都是第一名的辉煌成绩,与通话前半个小时回忆初入ACM班的“无所适从”俨然鲜明的对比。来自陕西省兴平市西郊高级中学的杨笛一,在20.原创 2022-03-07 16:49:13 · 1130 阅读 · 0 评论 -
她力量系列五丨朱海一:以人为本,构建 AI 价值观
文章转载丨AI科技评论作者:陈彩娴“一个机器学习算法再先进,如果最终要在人类社会中落地,都是要考虑终端用户的体验与需求。”例如,一个具备人脸识别功能的智能锁最终是要为人类所使用,共享乘车平台所使用的派单优化匹配算法与司机、乘客相关,社交平台上的资讯优化排序直接影响用户阅读体验及对社会的感知,等等。在人工智能技术的落地中,算法所体现的价值观与技术同等重要。基于此,朱海一提到“以人为中心”的研究理念,重申了机器学习与人机交互研究的关系。朱海一现任卡内基梅隆大学计算机科学学院人机交互系(HCII)Dani.原创 2022-03-07 16:43:26 · 542 阅读 · 0 评论 -
她力量系列四丨读博6年两次换导师,靠一点点“倔”,俞舟成为social chatbot的开拓者之一
文章转载丨AI科技评论作者:陈彩娴导语:读博六年,两次换博士导师、差点交不上学费,还能顺利毕业、成为所在领域的青年佼佼者之一,俞舟不简单。作者 | 陈彩娴在俞舟的想象中,智能机器的存在不仅是为了执行人类下达的任务,而是拥有与人类相近的感知与情绪,可以与人类建立情感的纽带。比如,在电影《她》(Her)中由斯嘉丽·约翰逊配音的OS对话系统,既可以帮助用户完成会议安排、信件阅读与文稿撰写等工作,也能够以朋友的身份陪伴他们,与他们谈天说地,理解人类的情绪并作出回应。因此,在2014年刚接触对话系统时,俞舟.原创 2022-03-07 16:39:53 · 799 阅读 · 0 评论 -
她力量系列三丨把握当下,坚持热爱,与食物图像识别结缘的科研之路
文章转载丨智源社区作者:Isabel、李梦佳导读:初识复旦大学计算机学院陈静静,人们可能会着眼于她取得的令人瞩目的学术成绩——复旦大学计算机科学技术学院青年副研究员、上海高层次海外人才、浦江人才计划入选者、ACM China上海新星奖获奖者,累计发表学术论文 30 余篇,获得ACM Multimedia 2016最佳学生论文奖、Multimedia Modeling 2017 最佳学生论文奖等荣誉,还担任多个国际知名期刊审稿人,以及国际会议领域主席/程序委员会委员。不同于外界对于学术研究者“严肃”.原创 2022-03-07 16:33:18 · 276 阅读 · 0 评论 -
她力量系列二丨UCLA李婧翌:女性最不需要做的就是「怀疑自己」
文章转载丨智源社区作者:Isabel、李梦佳“如果给所有女性科研工作者一个建议,是什么?”“听从自己内心的需求。”李婧翌,2007年清华生物系毕业生,加州大学洛杉矶分校(UCLA)统计系终身副教授,2018年斯隆奖获得者,入选《麻省理工科技评论》“35 岁以下科技创新35 人”(Innovators Under 35)2020 年中国区榜单。当这些耀眼的标签在同一个人身上出现时,人们就知道,这一定是位不平凡的女性。最近,李婧翌刚好在读一本书,是Facebook 首席运营官Sheryl San.原创 2022-03-07 16:27:34 · 791 阅读 · 0 评论 -
她力量系列一丨复旦大学黄萱菁教授:期待更多女性领会计算机科学的奥妙
文章转载丨社媒派SMP作者:陈姝学者主页:https://www.aminer.cn/profile/xuanjing-huang/542a3923dabfae646d541b38平实而深刻的热爱谈及当初为何会选择人工智能,黄萱菁打开了记忆大门。20多年前,她的导师吴立德教授给了她很多启发。吴立德是复旦大学首席教授,理论功底非常深厚。黄萱菁从导师身上学到了什么是研究,如何通过研究得到学术乐趣。当时吴老师的研究方向围绕人工智能布局,包括计算语言学和计算机视觉,并不算热门,而如今,人工智能已是炙手可.原创 2022-03-07 16:22:50 · 776 阅读 · 0 评论 -
2022 年人工智能全球最具影响力学者榜单——AI 2000 发布,中国占据两大榜首
2022 年 1 月 25 日,2022 年人工智能全球最具影响力学者榜单——AI 2000 重磅发布!人工智能全球最具影响力学者榜单(简称“AI 2000”),由清华大学计算机系 AMiner 团队联合智谱AI、清华—中国工程科技知识中心知识智能联合研究中心共同发布,旨在通过 AMiner 学术数据在全球范围内遴选过去十年人工智能学科最有影响力、最具活力的顶级学者。自 2020 年首届 AI 2000 发布以来,受到各界高度认可,已成为 AI 领域的重要风向标之一。其 2020 和 2021 年度相转载 2022-01-27 17:09:57 · 785 阅读 · 0 评论 -
【无标题】
关于周刊强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写为第28期《强化学习周刊》。本期周刊整理了强化学习领域相关的最新论文推荐和研究综述等,以飨诸位。本期贡献者:李明、刘青、小胖、陈元文章来源:智源社区论文推荐强化学习近年来取得了令人瞩目的成就,其应用于各个领域的研究也取得较大的进步,比如鲁棒强化学习、强化学习在靠泊系统及基金强权的应用、深度强化学习应用于推荐系统、离线深度强化学习及多智能体强化学习原创 2021-12-13 17:07:40 · 2522 阅读 · 0 评论 -
《预训练周刊》第30期:谷歌首次展示新版语言模型BERT,参数达4810亿个
关于周刊本期周刊,我们选择了9篇预训练相关的论文,涉及文本更正、模型适配、实体标记、视频理解、三维建模、行人识别、医学实体识别、分子分布和目标检测的探索。此外,在研究动态方面,我们选择了1篇预训练资讯,将介绍大语言模型方面的一些最新内容。最后,在资源推荐方面,我们选择了1篇预训练资源,将介绍生物医学实验方面的一些最新资源。本期贡献者:申德周 翟珂 吴新刚文章来源:智源社区论文推荐标题:伊利诺伊大学、微软|COCO-LM: Correcting and Contrasting Text Sequen原创 2021-12-13 16:56:33 · 1537 阅读 · 0 评论 -
AMiner订阅小程序上线,随时随地掌握最新科研成果
你还在为了找不到论文而苦恼吗?你还在担心自己跟不上研究领域的热点嘛?你还在害怕自己和领域大牛错过吗? 不要犹豫,来试试这款新上线的小程序吧,排队时、地铁上,不限使用场景,随时随地掌握最新科研咨询,让你的科研生涯从此走上人生同组巅峰。 Aminer订阅,你的科研得力助手!科技情报大数据挖掘与服务系统平台 AMiner,是由清华大学计算机系唐杰教授团队建立,具有完全自主知识产权的新一代科技情报分析与挖掘平台。AMiner 订阅小程序,同网页版的订阅模块功能一样齐全,享有 Aminer 全部的数据库,可以通原创 2021-12-10 17:07:29 · 2221 阅读 · 0 评论 -
《强化学习周刊》第27期:MIT研究表明通用LTL目标的强化学习很难实现
关于周刊强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写为第27期《强化学习周刊》。本期周刊整理了强化学习领域相关的最新论文推荐等,以飨诸位。本期贡献者:李明、刘青、小胖、陈元文章来源:智源社区论文推荐强化学习近年来取得了令人瞩目的成就,其应用于各个领域的研究也取得较大的进步,比如深度强化学习、非策略强化学习、基于通用目标的强化学习、基于协作深度强化学习、贝叶斯多智能体强化学习及人机协作强化学习相关的原创 2021-12-08 16:59:44 · 418 阅读 · 0 评论 -
《因果学习周刊》第6期:因果推荐系统
关于周刊因果学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写了第6期《因果学习周刊》。现如今,推荐系统在工业界得到了广泛的应用并带来了丰厚的利润,有关推荐系统的研究也具有十分深远的意义与巨大的实用价值,而如何产生更加符合用户真实兴趣的推荐也成为了重要的问题。为了解决现有推荐系统中广泛存在的以流行度偏差(Popularity Bias)为代表的数据偏差问题,许多研究者将因果推断中的方法引入到推荐系统的设计中,来抵原创 2021-12-08 16:42:27 · 414 阅读 · 0 评论 -
《预训练周刊》第29期:Swin Transformer V2:扩大容量和分辨率、SimMIM:用于遮蔽图像建模的简单框架
关于周刊本期周刊,我们选择了10篇预训练相关的论文,涉及图像处理、图像屏蔽编码、推荐系统、语言模型解释、多模态表征、多语言建模、推理优化、细胞抗原预测、蛋白结构理解和化学反应的探索。此外,在资源分享方面,我们选择了2篇预训练资源,将介绍视频理解和生物图像处理方面的一些最新内容。本期贡献者:申德周 翟珂 吴新刚文章来源:智源社区论文推荐标题:微软|Swin Transformer V2: Scaling Up Capacity and Resolution(Swin Transformer V2:扩原创 2021-12-08 16:35:23 · 515 阅读 · 0 评论 -
《强化学习周刊》第26期:UCL& UC Berkeley发表深度强化学习中的泛化研究综述、JHU推出基于强化学习的人工决策模型
关于周刊强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写为第26期《强化学习周刊》。本期周刊整理了强化学习领域相关的最新论文推荐和新工具、数据集等,以飨诸位。本期贡献者:李明、刘青、小胖、陈元文章来源:智源社区论文推荐强化学习近年来取得了令人瞩目的成就,其应用于各个领域的研究也取得较大的进步,比如目标条件强化学习、基人工决策模型强化学习、深度强化学习在恶意软件中的应用、无模型风险敏感强化学习、迁移强化原创 2021-11-29 21:31:33 · 2631 阅读 · 0 评论 -
《因果学习周刊》第4期:因果发现方法
关于周刊因果学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写了第4期《因果学习周刊》。发现一组变量之间的因果结构是因果学习中的一个基本问题,旨在理解数据生成的因果机制。在各种科学和工业场景中,这也是一项至关重要的任务,在生物学、卫生保健和经济学等许多领域有着重要的应用,对于算法可解释性、稳定性和公平性的研究也有着重要的作用。在因果发现中,学习到的因果图的形式为有向无环图(DAG),一种有效的方法是进行随机对照实原创 2021-11-29 21:23:21 · 3896 阅读 · 0 评论 -
《预训练周刊》第28期:M6-10T:高效多万亿参数预训练的共享去链接范式、大模型自然语言处理的最新进展综述
关于周刊本期周刊,我们选择了11篇预训练相关的论文,涉及模型训练、图像编码、气候文本、对比学习、文本生成评估、小样本学习、决策推理、胚胎突变预测、蛋白质分析、数据集检测和模型可解释性的探索。此外,在研究动态方面,我们选择了1篇预训练资讯,将介绍大模型综述方面的一些最新内容。(本期贡献者:申德周 翟珂 吴新刚)文章来源:智源社区论文推荐标题:阿里|M6-10T: A SHARING-DELINKING PARADIGM FOR EFFICIENT MULTI-TRILLION PARAMETER P原创 2021-11-29 21:17:26 · 408 阅读 · 0 评论 -
《因果学习周刊》第5期:NeurIPS2021 因果发现最新进展
关于周刊因果学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写了第5期《因果学习周刊》。本期周刊承接上期中关于因果发现(Causal Discovery)的介绍,总结了最新放榜的NeurIPS 2021会议接收论文中与因果发现相关的文章,代表了因果发现领域最前沿的关注方向与最新进展,也提出了一些新的问题设定与全新算法,希望给同领域或相似领域的研究者带来帮助和启发。本期贡献者:刘家硕文章来源:智源社区论文推荐原创 2021-11-29 21:08:36 · 1631 阅读 · 0 评论 -
《强化学习周刊》第25期:DeepMind提出无模型风险敏感强化学习、谷歌发布 RLDS数据集生态系统
关于周刊强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写为第25期《强化学习周刊》。本期周刊整理了强化学习领域相关的最新论文推荐和新工具、数据集等,以飨诸位。本期贡献者:李明、刘青、小胖、陈元文章来源:智源社区论文推荐强化学习近年来取得了令人瞩目的成就,其应用于各个领域的研究也取得较大的进步,比如分层强化学习、基准偏好的强化学习、基于深度强化学习的机器人控制、无模型风险敏感强化学习、安全强化学习相关的原创 2021-11-17 14:25:06 · 355 阅读 · 0 评论 -
《因果学习周刊》第3期:从因果学习到不变学习方法
关于周刊因果学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写了第3期《因果学习周刊》。本期周刊推荐的8篇论文,延续了第1期周刊中关于解决分布外泛化问题(Out-of-Distribution Generalization)的不变学习方法的介绍,包含了不变学习方法最新的进展。这类方法提出了从数据中学习具有因果不变性质的表征或模型,使得模型对于分布偏移具有很好的抵抗作用,对于机器学习模型走向应用,特别是高风险领域,原创 2021-11-16 15:56:15 · 415 阅读 · 0 评论 -
AMiner推荐论文:A Normalized Gaussian Wasserstein Distance for Tiny Object Detection
论文链接: https://www.aminer.cn/pub/6178c43b5244ab9dcbb2b674?f=cs小目标在许多现实世界的应用中无处不在,包括驾驶辅助、大规模监控和海上救援。尽管由于深度神经网络的发展,目标检测取得了显著的进展,但大多数都是用于检测正常大小的目标。而小目标(AI-TOD数据集中小于像素)往往表现出极其有限的外观信息,增加了识别特征的学习难度,导致小目标检测失败的案例非常多。小目标检测(TOD)的研究进展主要集中在改进特征识别方面。为了提高小目标和相应特征的分辨率,对原创 2021-11-16 15:09:20 · 4568 阅读 · 6 评论 -
AMiner推荐论文:Few-fs resolution of a photoactive protein traversing a conical intersection.
论文链接: https://www.aminer.cn/pub/61850ac75244ab9dcb7ac232?f=csMeta 提出的单个多语言模型,首次超过最佳双语模型,赢得了著名的 WMT 竞赛。作为分子几何学函数的分子电子的量子力学能量,产生了用于原子核运动的有效势能面。当有 d 个核自由度时,势能面(PES)是 d 维的。在所谓的波恩-奥本海默(BO)近似中,电子自由度和核自由度是分开处理的。当两个 PES 接触时,BO 近似不再有效。锥形交叉点是这种势能简并的区域,形成一个(d – 2)原创 2021-11-16 15:08:34 · 677 阅读 · 0 评论 -
AMiner推荐论文:Facebook AI WMT21 News Translation Task Submission
论文链接:https://www.aminer.cn/pub/6111f7de5244ab9dcb065084?f=csMeta 提出的单个多语言模型,首次超过最佳双语模型,赢得了著名的 WMT 竞赛。机器翻译(MT)领域的最终目标是构建一个通用的翻译系统,以帮助用户获取信息并更好地相互联系。但是 MT 领域需要解决实际应用中遇到的基本局限性,未来才能更好的使用。如今,大多数 MT 系统使用双语模型组,这通常需要为每个语言对和任务提供大量标记示例。不幸的是,这种方法对于训练数据很少的语言(例如冰岛语、原创 2021-11-16 15:07:40 · 1974 阅读 · 0 评论 -
AMiner推荐论文:Hierarchical Transformers Are More Efficient Language Models
论文链接: https://www.aminer.cn/pub/6178c43c5244ab9dcbb2b868?f=cs谷歌、OpenAI和华沙大学的一个团队提出了一种新的用于语言建模的高效Transformer架构Hourglass,在ImageNet32上达到新的SOTA,证明拥有一个明确的分层结构是Transformer能有效处理长序列的关键。Hourglass在给定相同计算量和存储量的情况下,可以产生比Transformer更好的结果。>>加入极市CV技术交流群,走在计算机视觉的最前原创 2021-11-15 16:57:42 · 655 阅读 · 0 评论 -
AMiner推荐论文:Interpretable and Efficient Heterogeneous Graph Convolutional Network
论文链接: https://www.aminer.cn/pub/5ecf8d2391e01149f850f4a5?f=cs目前面向异质图的图卷积神经网络普遍存在两个重要的不足:(1)大部分已有工作依赖用户人工输入一系列任务相关的元路径(Meta-path),这对于没有专业知识的用户来说是困难的。换句话说,已有方法无法有效地、灵活地从所有可能的元路径中自动挖掘出针对某个任务的最优元路径,这阻碍了模型的有效性和可解释性;(2)大部分已有方法在执行图卷积之前都需要执行额外的、耗时的预处理操作,这显著增加了模型的原创 2021-11-15 16:56:56 · 668 阅读 · 0 评论 -
AMiner推荐论文:Masked Autoencoders Are Scalable Vision Learners
论文链接: https://www.aminer.cn/pub/618ddb455244ab9dcbda8f5f?f=cs作者先将图像均匀划分为非重叠区块,然后随机对区块进行采样。以遮蔽比例75%为例,它先在输入图像中掩蔽75%的随机区块,编码器只在可见的25%区块子集上运行,这样就可以只用非常少的计算和显存,来训练非常大的编码器。然后解码器将可见的token和掩码token组合,并向所有token中添加位置嵌入,通过预测每个掩蔽区块的像素值来重建图像信号。这样一来,在预训练时解码器可以独立于编码器原创 2021-11-15 16:56:14 · 994 阅读 · 0 评论 -
AMiner推荐论文:NLP From Scratch Without Large-Scale Pretraining: A Simple and Efficient Framework
论文链接:https://www.aminer.cn/pub/6189e6d05244ab9dcb76e71a?f=cs预训练语言模型因其强大的性能被广泛关注,基于预训练 - 微调(pretraining-finetuning)的范式也已经成为许多 NLP 任务的标准方法。然而,当前通用语言模型的预训练成本极其高昂,这使得只有少数资源充足的研究机构或者组织能够对其展开探索。这种 「昂贵而集权」的研究模式限制了平民研究者们为 NLP 社区做出贡献的边界,甚至为该领域的长期发展带来了障碍。近期,为了缓解这一原创 2021-11-15 16:55:36 · 660 阅读 · 0 评论 -
图神经网络论文合集
1.论文名称:Weisfeiler and Leman Go Neural: Higher-order Graph Neural Networks.链接:https://www.aminer.cn/pub/5bdc31b417c44a1f58a0b240/?f=cs2.论文名称:Graph Convolutional Encoders for Syntax-aware Neural Machine Translation.链接:https://www.aminer.cn/pub/599c7954601原创 2021-11-12 17:05:57 · 588 阅读 · 0 评论 -
AMiner推荐论文:TiKick: Toward Playing Multi-agent Football Full Games from Single-agent Demonstrations
论文链接:https://www.aminer.cn/pub/6164fcc15244ab9dcb24cf7a?f=cs在多项国际赛事中夺得冠军则是指,TiKick在单智能体控制和多智能体控制上均取得了SOTA性能,并且还是首次实现同时操控十个球员完成整个足球游戏。这支强大的AI团队是如何训练出来的呢?从单智能体策略中进化出的多智能体足球AI在此之前,先简单了解一下训练所用的强化学习环境,也就是这个足球游戏:Google Research Football(GRF)。它由谷歌于2019年发布,提供原创 2021-11-12 12:58:46 · 2696 阅读 · 0 评论 -
AMiner推荐论文:Efficient and targeted COVID-19 border testing via reinforcement learning
论文链接: https://www.aminer.cn/pub/6172abac5244ab9dcbc28b14?f=cs在整个 COVID-19 大流行期间,不少国家依靠各种临时边境控制协议,在保障公共卫生的同时允许必要的旅行:从隔离所有旅行者,到根据病例、死亡或阳性检测率等全民流行病学指标限制特定国家人员入境。许多国家/地区会随机或根据风险类别选择旅客进行 COVID-19测试。例如,来自高感染率地区的人可能比来自低感染率地区的人优先接受检测。但 Eva 有所不同,Eva 将实时检测数据与访客在抵达原创 2021-11-12 12:57:59 · 251 阅读 · 0 评论