AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
Fast And Slow Learning Of Recurrent Independent Mechanisms
论文链接:https://www.aminer.cn/pub/609a6e00e4510cd7c8902d28
推荐理由: 当分布发生变化时,将知识分解成可互换的碎片能够获得泛化优势,而一个与环境互动的学习代理需要对现有知识片段进行新的组合。作者假设上述知识分解对于系统方式概括分布以外的变化尤为重要,从而提出了一个特殊的训练框架。作者假设一个代理人所需的知识片断和奖励函数是固定的,并且可以在不同的任务中重复使用,其中的注意力机制动态地选择模块来适应当前任务,允许所选模块的参数在学习者在变化中迅速改变,而注意力机制参数则作为稳定的、缓慢变化的元参数。作者发现,元学习所提出的系统模块有助于在强化学习中实现更快的适应,但将参数和元参数的作用颠倒过来的效果并不理想,这表明动态选择模块在快速适应方面有特殊作用。




下论文,到AMiner:https://www.aminer.cn/
#AMiner# #论文#

AMiner是由清华大学研发的学术图谱平台,提供学者服务和科技情报。平台拥有大量学术论文和学者数据,受到全球广泛访问。论文《FastAndSlowLearningOfRecurrentIndependentMechanisms》探讨了在分布变化时,知识分解如何帮助学习代理快速适应,提出了一种注意力机制动态选择模块的训练框架,以实现快速学习和适应。研究表明,这种动态选择在快速适应中有重要作用。
2万+

被折叠的 条评论
为什么被折叠?



