
深度学习
文章平均质量分 92
fareise
这个作者很懒,什么都没留下…
展开
-
只用全连接,也能搭建SOTA时间序列预测模型?
Nbeats系列模型解析原创 2022-06-04 22:48:06 · 427 阅读 · 0 评论 -
如何建模时间序列的不确定性?
这篇文章给大家详细介绍一下这两种方法,以及采用这两种方法的经典时间序列预测论文。原创 2022-05-29 10:07:37 · 773 阅读 · 0 评论 -
如何搭建适合时间序列预测的Transformer模型?
如何搭建适合时间序列预测的Transformr模型原创 2022-05-21 17:19:24 · 1534 阅读 · 1 评论 -
图学习?Transformer:我也行
微信公众号“圆圆的算法笔记”,持续更新NLP、CV、搜推广干货笔记和业内前沿工作解读~后台回复“交流”加入“圆圆的算法笔记”交流群;回复“时间序列“、”多模态“、”迁移学习“、”NLP“、”图学习“等获取各个领域干货算法笔记~Transformer诞生于NLP领域,目前已经成为NLP中的主力模型。同时,Transformer在CV领域也逐渐显示出其超强的能力,诸如ViT、Swin Transformer、BEiT等Vision Transformer模型验证了Transformer同样适.原创 2022-05-15 12:03:47 · 1853 阅读 · 0 评论 -
Multilingual多语言预训练的那些套路
这篇文章就为大家整理了Multilingual多语言预训练语言模型的套路,包括XLM、XLM-R、ERNIE-M、Unicoder、ALM等5个经典模型,以及这些模型之间的演进关系。原创 2022-05-01 21:52:11 · 1895 阅读 · 0 评论 -
层次时间序列预测指南
如果觉得我的算法分享对你有帮助,欢迎关注我的微信公众号“圆圆的算法笔记”,定期更新深度学习/CV/NLP/搜推广干货笔记,和世间万物的学习记录~层次时间序列预测是工业界非常常见的一个应用场景。当要预估的时间序列之间存在层次关系,不同层次的时间序列需要满足一定的和约束时,就需要利用层次时间序列预测方法解决。设想这样一种场景,我们作为政府负责旅游业的部门,需要预测出澳大利亚每个月的旅游人数,同时还需要预测澳大利亚每个州的旅游人数,以及每个州中每个区的旅游人数。如果澳大利亚包括10个州,每个州包括5个地区,那原创 2022-04-23 22:37:14 · 1827 阅读 · 0 评论 -
Spatial-Temporal时间序列预测建模方法汇总
目前解决时间+空间预估的方法主要包括基于图的时序预估和基于矩阵分解的时序预估两种方法。本文通过6篇顶会论文介绍了这两种类型方法的发展历程。原创 2022-04-05 15:57:40 · 2371 阅读 · 0 评论 -
NLP Prompt系列——Prompt Engineering方法详细梳理
这篇文章详细汇总了近2年10篇论文中3种Prompt Engineering方法,主要包括人工构造prompt、自动生成prompt、隐空间prompt3种类型,看看顶会论文中都是如何构造prompt模板并以此提升prompt效果的。原创 2022-03-29 08:53:26 · 3404 阅读 · 0 评论 -
ICLR 2022 | BEIT论文解读:将MLM无监督预训练应用到CV领域
介绍Vision Transformer最新工作BEiT以及和历史工作的对比原创 2022-03-26 09:24:34 · 4744 阅读 · 0 评论 -
迁移学习花式Finetune方法大汇总
本文介绍了来自2018年以来ICML、CVPR等顶会的7篇论文,总结了Finetune的四种类型招式,通过更科学的Finetune方式,提升迁移学习效果。原创 2022-03-20 19:20:53 · 1407 阅读 · 0 评论 -
算法工程师必须了解的工程原理—分布式训练
本文将对分布式训练原理,以及常见的Parameter Server分布式架构和Ring Allreduce分布式架构进行简单介绍。原创 2022-03-17 22:31:18 · 1322 阅读 · 0 评论 -
8篇论文详解用户历史行为序列建模方法
本文汇总了8篇推荐系统中对用户历史行为序列建模的方法,包括DIN、DIEN等经典模型。原创 2022-03-13 17:59:56 · 3354 阅读 · 0 评论 -
命名实体识别(NER)详解及小样本下的NER问题解法汇总
本文带你走进命名实体识别(NER)任务,首先介绍了解决NER任务的经典模型结构,然后通过3篇顶会论文介绍当缺少训练样本的时候,如何解决NER任务。原创 2022-03-10 21:43:30 · 3168 阅读 · 0 评论 -
从ViT到Swin,10篇顶会论文看Transformer在CV领域的发展历程
本文梳理了近期10篇Transformer、Attention机制在计算机视觉领域的应用,从ViT到Swin Transformer,完整了解CV Transformer的发展过程。原创 2022-03-05 14:37:45 · 2987 阅读 · 0 评论 -
NLP中的绿色Finetune方法大汇总
本文重点介绍近两年几个NLP中finetune优化的经典工作,包括adapter-finetune、side-tuning、mask-finetune以及prefix-finetune等工作。原创 2022-03-03 08:22:14 · 943 阅读 · 0 评论 -
Transformer提效之路——一文梳理各种魔改版本Transformer
本文首先介绍了Transformer模型的基本结构,然后详细介绍了9篇针对Transformer效率优化、长序列建模优化的顶会论文。原创 2022-02-26 14:13:01 · 2107 阅读 · 0 评论 -
Meta-learning原来有这么多用途,一文汇总元学习在5个问题中的应用
本文梳理了业内近几年利用meta-learning解决不同场景问题的顶会论文,涉及meta-learning在域自适应、迁移学习、图学习、正负样本不均衡、知识蒸馏等多个场景的应用原创 2022-02-23 21:26:33 · 2137 阅读 · 0 评论 -
7篇顶会论文带你梳理多任务学习建模方法
本文从最基础的多任务学习开始,梳理了近几年来7篇多任务学习顶会相关工作,包括Hard/Soft Parameter Sharing、参数共享+门控、学习参数共享方式等建模方式。原创 2022-02-19 19:45:58 · 1890 阅读 · 0 评论 -
Meta-learning核心思想及近年顶会3个优化方向
本文首先从不同角度介绍对meta-learning的理解,然后进一步介绍meta-learning的典型模型MAML的原理。在此基础上,介绍了5篇近3年的顶会的论文,从3个角度揭示了meta-learning在学术界的优化方向。原创 2022-02-16 08:46:37 · 448 阅读 · 0 评论 -
12篇顶会论文,深度学习时间序列预测经典方案汇总
本文介绍了深度学习模型在时间序列预测问题中的应用,主要包括RNN、CNN、Transformer、Nbeats等4种类型模型,以及12篇相关顶会论文,全面掌握深度学习时间序列预测方法。原创 2022-02-12 18:36:58 · 2149 阅读 · 0 评论 -
一文读懂CTR预估模型的发展历程
本文介绍了点击率预估模型的发展历程,从DNN模型和FM模型出发,介绍了FM和DNN相结合,以及针对DNN/FM问题进行的改进,梳理了近年来点击率预估模型的整体发展历程,包括DeepFM、FNN、PNN、DCN、Wide&Deep等原创 2022-02-10 08:25:39 · 1080 阅读 · 0 评论 -
Domain Adaptation:缺少有监督数据场景下的迁移学习利器
Domain Adaptation:缺少有监督数据场景下的迁移学习利器。迁移学习在无监督任务中的实现方法,介绍多篇顶会论文关于Domain Adaptation的最新研究原创 2022-02-07 22:51:01 · 1438 阅读 · 0 评论