
一、摘要
近年来,基于Transformer的方法在长期序列预测领域取得了令人惊讶的性能,但计算全局相关性的注意力机制具有很高的复杂性。而且它们不允许像 CNN 结构那样对局部特征进行有针对性的建模。为了解决上述问题,我们建议结合局部特征和全局相关性来捕捉时间序列的整体视图(例如,波动、趋势)。为了充分利用时间序列中的底层信息,采用多尺度分支结构对不同的势型进行分别建模。每个模式分别使用下采样卷积和等距卷积提取局部特征和全局相关性。除了更有效之外,我们提出的方法被称为多尺度等距卷积网络(MICN),在具有合适卷积核的序列长度线性复杂度方面效率更高。我们在六个基准数据集上的实验表明,与最先进的方法相比,MICN 在多变量和单变量时间序列方面分别产生了 17.2% 和 21.6% 的相对改进。
二、研究背景
1、研究问题:这篇文章旨在解决长期时间序列预测中的问题,特别是如何有效地捕捉时间序列的局部特征和全局相关性。
2、研究难点:该问题的研究难点在于现有的基于Transformer的方法虽然能够有效建模长距离依赖,但其计算复杂度高,且难以针对性地建模局部特征。而基于CNN的方法如TCN虽然能更好地整合局部信息,但受限于感受野大小,往往需要多层网络来建模全局关系,增加了网络复杂度和训练难度。
3、相关工作:现有工作主要包括基于CNN的模型(如TCN)和基于Transformer的模型(如Informer、Autoformer等)。TCN通过因果卷积和膨胀卷积来建模时间因果性和扩展感受野,而Transformer通过自注意力机制来建模长距离依赖。然而,这些方法在计算复杂度和局部/全局特征建模方面仍存在不足。
三、论文贡献
- 提出基于卷积结构的MICN来高效替代自注意力,并实现线性计算复杂度和内存成本。
- 我们提出了一个多分支框架来深入挖掘时间序列的复杂时间模式,当输入数据复杂且多变时,它验证了单独建模的必要性和有效性。
- 提出了一种局部-全局结构来实现时间序列的信息聚合和长期依赖建模,该结构优于自注意力族和自相关机制。我们采用下采样一维卷积进行局部特征提取,采用等距卷积进行全局相关性发现。
四、研究方法
本文提出了一种名为多尺度等距卷积网络(MICN)的方法,通过结合局部特征和全局相关性来捕捉时间序列的整体视图。

将输入序列送到多尺度混合分解模块中进行序列分解,得到Seasonal项和Trend-cyclical项,采用不同的模块分别对两者独立进行预测,最后将预测结果加起来得到序列的预测值。对于Trend-cyclical项,直接采用线性回归的方式进行预测。对于Seasonal项,采用提出的Seasonal Prediction Block进行预测。
五、多尺度混合分解

采用不同大小的kernel控制不同的分解模式,对多个kernel平均池化的结果取平均得到Trend-cyclical项,输入序列减去Trend-cyclical项得到Seasonal项。
六、Seasonal Prediction Block

季节预测块首先对输入序列的季节部分进行Embedding,再通过N个堆叠的MIC层进行预测。每个MIC层有多个分支(branch),每个分支采取不同的尺度大小,对不同的时间模式进行建模。

Embedding采用三个部分来嵌入输入,TFE(时间特征编码)、PE(位置编码)和VE(值嵌入)。

MIC层首先使用kernel大小为i的平均池化进行处理,然后使用 kernel=i, stride=i 的一维卷积来进行降采样,压缩得到局部特征。

再采用等距卷积(Isometric Convolution)建模局部特征间的关系来建模序列的全局相关性。然后采用转置卷积进行上采样恢复序列长度。

最后采用二维卷积融合不同尺度的信息,馈送到前馈网络和Add&Norm得到该层的输出。

七、数据集
论文在六个真实世界的时间序列基准数据集上进行实验,ETTm2、Exchange、ILI、Traffic、Electricity和Weather数据集。
八、baseline模型
四个基于transformer的模型:FEDformer、Autoformer、Informer、LogTrans,两个基于RNN的模型:LSTM、LSTNet和基于CNN的模型TCN作为基线。
九、结果与分析

十、总结
本文提出了一种新的多尺度等距卷积网络(MICN),通过结合局部特征和全局相关性来捕捉时间序列的整体视图。实验结果表明,MICN在多个真实世界数据集上取得了最先进的长期时间序列预测性能。
如何学习大模型 AI ?
我国在AI大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着Al技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国Al产业的创新步伐。加强人才培养,优化教育体系,国际合作并进,是破解困局、推动AI发展的关键。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

2025最新大模型学习路线
明确的学习路线至关重要。它能指引新人起点、规划学习顺序、明确核心知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。
对于从来没有接触过AI大模型的同学,我帮大家准备了从零基础到精通学习成长路线图以及学习规划。可以说是最科学最系统的学习路线。

针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。
大模型经典PDF书籍
新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路!

配套大模型项目实战
所有视频教程所涉及的实战项目和项目源码等

博主介绍+AI项目案例集锦
MoPaaS专注于Al技术能力建设与应用场景开发,与智学优课联合孵化,培养适合未来发展需求的技术性人才和应用型领袖。


这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

为什么要学习大模型?
2025人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

适合人群
- 在校学生:包括专科、本科、硕士和博士研究生。学生应具备扎实的编程基础和一定的数学基础,有志于深入AGI大模型行业,希望开展相关的研究和开发工作。
- IT行业从业人员:包括在职或失业者,涵盖开发、测试、运维、产品经理等职务。拥有一定的IT从业经验,至少1年以上的编程工作经验,对大模型技术感兴趣或有业务需求,希望通过课程提升自身在IT领域的竞争力。
- IT管理及技术研究领域人员:包括技术经理、技术负责人、CTO、架构师、研究员等角色。这些人员需要跟随技术发展趋势,主导技术创新,推动大模型技术在企业业务中的应用与改造。
- 传统AI从业人员:包括算法工程师、机器视觉工程师、深度学习工程师等。这些AI技术人才原先从事机器视觉、自然语言处理、推荐系统等领域工作,现需要快速补充大模型技术能力,获得大模型训练微调的实操技能,以适应新的技术发展趋势。

课程精彩瞬间
大模型核心原理与Prompt:掌握大语言模型的核心知识,了解行业应用与趋势;熟练Python编程,提升提示工程技能,为Al应用开发打下坚实基础。
RAG应用开发工程:掌握RAG应用开发全流程,理解前沿技术,提升商业化分析与优化能力,通过实战项目加深理解与应用。
Agent应用架构进阶实践:掌握大模型Agent技术的核心原理与实践应用,能够独立完成Agent系统的设计与开发,提升多智能体协同与复杂任务处理的能力,为AI产品的创新与优化提供有力支持。
模型微调与私有化大模型:掌握大模型微调与私有化部署技能,提升模型优化与部署能力,为大模型项目落地打下坚实基础。
顶尖师资,深耕AI大模型前沿技术
实战专家亲授,让你少走弯路

一对一学习规划,职业生涯指导
- 真实商业项目实训
- 大厂绿色直通车
人才库优秀学员参与真实商业项目实训
以商业交付标准作为学习标准,具备真实大模型项目实践操作经验可写入简历,支持项目背调
大厂绿色直通车,冲击行业高薪岗位
文中涉及到的完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】







790

被折叠的 条评论
为什么被折叠?



