自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(180)
  • 资源 (2)
  • 收藏
  • 关注

原创 有深度!Transformer | 万字长文:详细了解前馈神经网络(FFN),内含对大模型的理解

FFN(Feed-Forward Network)扮演着至关重要的角色。本文将深入介绍FFN层的结构、数学原理、源码理解、在大模型中的应用等内容,旨在揭示其如何通过升维和降维操作增强模型的表达能力,以及其在Transformer中的独特作用。

2025-04-03 11:13:26 174

原创 Transformer | 一文了解:缩放、批量、多头、掩码、交叉注意力机制(Attention)

这篇文章填补了之前对Attention综述介绍,本文更加细节,利用纯Python和Numpy实现注意力模块,并解释了整个过程中的所有向量维度的变化,对刚入门的新手非常友好。

2025-03-27 22:21:53 610

原创 大模型Agent的 “USB”接口!| 一文详细了解MCP(模型上下文协议)

之前的时候,让大模型做外部工具调用基本上都是通过Function Calling的方式,最近随着大模型Agent工作流的兴起,有一个新的概念:MCP逐渐进入大家的视野,基于MCP,它可以让非开发人员在不需要编辑Agent逻辑的情况下,为代理添加工具。

2025-03-25 22:45:12 1046

原创 DeepSeek | DeepSeek-V3新版本模型:DeepSeek-V3-0324,数学推理显著提升

DeepSeek-V3模型升级:DeepSeek-V3-0324,数学推理显著提升

2025-03-25 13:47:54 643

原创 万字长文!从AI Agent到Agent工作流,一文详细了解代理工作流(Agentic Workflows)

万字长文!从AI Agent到Agent工作流,一文详细了解代理工作流(Agentic Workflows)

2025-03-24 22:49:35 834

原创 LLM每周速递!学术最前沿:Agent应用、强化学习、RAG、复杂推理、多模态等

紧跟技术发展趋势,快速了解大模型最新动态。今天继续总结最近一周的研究动态,本片文章共计梳理了10篇有关大模型(LLMs)的最新研究进展,其中主要包括:多尺度注意力(Attention)、强化学习算DAPO算法、大模型多Agent系统、人形机器人、调研报告生成、多模型推理模型、长CoT推理模型、RAG系统能力提升应等热门研究。

2025-03-23 22:21:56 890

原创 台大李宏毅“生成式人工智能导论”(课件)

台大李宏毅老师“生成式人工智能导论”课件分享

2025-03-20 10:23:24 157

原创 盘点一下!大模型Agent的花式玩法,涉及娱乐、金融、新闻、软件等各个行业

大模型Agent在各个领域的“花式玩法”,涉及电影、博客、医疗、金融分析、软件、数据可视化、新闻审查、具身AI、web导航等,并且基本上都有源码的。

2025-03-19 23:47:17 908

原创 一文带你详细了解:大模型MoE架构(含DeepSeek MoE详解)

本文作者将带你了解 MoEs的发展史、核心组件、训练方法,推理中各因素考量和DeepSeek MoE详解。相关思维导图如下所示:

2025-03-18 23:10:36 586

原创 Emory & UTA | 提出Spatial-RAG——开启空间智能问答的新时代

本文作者推出了革命性的框架:Spatial-RAG,该框架通过结合空间数据库和LLM的语义理解能力,显著提升了空间推理任务的性能。

2025-03-18 10:56:23 265

原创 最新!Ubuntu Docker 安装教程

最新,Docker安装使用管理教程

2025-03-17 15:14:57 1337

原创 颠覆大模型归一化!Meta | 提出动态Tanh:DyT,无归一化的 Transformer 性能更强

今天Meta的这篇文章突破归一化层不可或缺传统观点,具体来说:提出了一种名为动态Tanh(DyT)的简单技术,用于替代Transformer中的归一化层,实验表明,使用DyT的无归一化Transformer在多种任务和领域中均能达到或超过传统归一化模型的性能,且大多无需超参数调整。

2025-03-16 17:10:13 874

原创 Attention又升级!Moonshot | 提出MoE注意力架构:MoBA,提升LLM长文本推理效率

本文作者将MoE的思想应用到了Attention机制上,提出了MoBA方法,该方法能够无缝切换全注意力和稀疏注意力,不仅提升了LLM推理效率,且保证了模型性能。

2025-03-13 23:07:15 958

原创 2025年的风口!| 万字长文让你了解大模型Agent

2025年的风口!| 万字长文,带你纵观大模型Agent,涉及研究痛点、应用场景、发展方向

2025-03-13 10:18:14 996

原创 大模型函数调用实操

大模型自动调用函数实操

2025-03-12 13:43:55 1092

原创 一文了解大模型Function Calling

大模型function calling

2025-03-12 10:46:58 809

原创 AAAI2025 | 论文接受列表,含全部论文下载(持续更新......)

AAAI主办的“AAAI人工智能会议”,被认为是人工智能领域的顶级会议之一,该会议每年举办一次,「会议等级A类」。

2025-03-06 23:48:33 2468

原创 一文了解AAAI国际会议(更新至AAAI2025)–附: 各年论文连接

AAAI主办的“AAAI人工智能会议”,被认为是人工智能领域的顶级会议之一,该会议每年举办一次,「会议等级A类」。

2025-03-06 22:55:12 1232

原创 AI 圣经---深度学习~花书分享

AI圣经,深度学习

2025-03-04 16:28:50 213

原创 这几天!DeepSeek开源周 | 发布5个重要代码库,涉及AI基础设施建设的关键节点

这几天!DeepSeek开源周 | 发布5个重要代码库,涉及AI基础设施建设的关键节点

2025-03-03 15:46:49 462

原创 万字长文!最全面的大模型Attention介绍,含DeepSeek MLA,含大量图示!

非常详细!万字长文带你了解Attention,从MHA到DeepSeek MLA,含大量图解!

2025-02-27 23:13:11 1040

原创 什么是KL散度

什么是KL散度

2025-02-20 15:54:41 786

原创 LLM每周速递!大模型最前沿:复杂推理大模型、多模态、大模型Agent、长文本推理提升等

LLM每周速递!大模型最前沿:复杂推理大模型、多模态、大模型Agent、长文本推理提升等热门研究方向

2024-11-26 10:01:32 1267

原创 UIUC | 提出“提取-精炼-检索-读取”框架:ERRR,提升RAG系统性能

本文提出了“提取-精炼-检索-读取”框架:ERRR,旨在缩小LLM的预检索信息差距,通过query优化更好地满足模型的知识需求,进而生成准确的回答。

2024-11-14 09:28:17 819

原创 NeurIPS2024接收论文列表!一文了解NeurIPS国际顶会【含历年NeurIPS论文下载】

自然语言处理NeurIPS国际顶会介绍,历年NeurIPS论文下载,NeurIPS2024下载,NeurIPS2023下载,NeurIPS2022下载,NeurIPS2021下载,NeurIPS2020下载,NeurIPS2019下载,NeurIPS2018下载,NeurIPS2017下载,NeurIPS2016下载.

2024-11-11 15:16:48 4925

原创 LLM每周速递!大模型最前沿:推理加速、模型微调/对齐、开源LLM、大模型Agent、多模态

LLM每周速递!大模型最前沿:推理加速、模型微调/对齐、开源LLM、大模型Agent、多模态

2024-11-10 22:31:57 925

原创 硬刚 LoRA!北航&微软 | 提出高秩适应LLMs微调法:MoRA,填补LoRA低秩缺陷!

北航&微软 | 提出高秩适应LLMs微调法:MoRA,填补LoRA低秩缺陷!

2024-05-22 16:11:08 1414

原创 ICLR 2024落幕,一文了解ICLR + 历年(2017-2024) 论文整理(含源码!)

一文了解ICLR

2024-05-13 09:16:34 3926

原创 碾压LoRA!Meta & CMU | 提出高效大模型微调方法:GaLore,内存可减少63.3%

碾压LoRA!Meta & CMU | 提出高效大模型微调方法:GaLore,内存可减少63.3%

2024-03-17 15:14:47 1945

原创 BIG-Bench Hard 数据集分享

BIG-Bench Hard 数据集分享

2024-03-17 14:43:51 3706

原创 BiG-Bench数据集分享

Big-Bench数据集分享

2024-03-15 09:29:38 900

原创 MBPP数据集分享

MBPP数据集分享

2024-03-15 09:26:58 2162

原创 APPS数据集分享

APPS数据集分享

2024-03-14 09:38:43 677

原创 HumanEval数据集分享

HumanEval数据集分享

2024-03-14 09:37:35 1909

原创 QuALITY数据集分享

QuALITY数据集分享

2024-03-12 11:01:35 843

原创 RACE数据集分享

RACE数据集分享

2024-03-12 10:59:11 740

原创 DROP数据集分享

DROP数据集分享

2024-03-11 09:31:54 939

原创 WinoGrande数据集分享

WinoGrande数据集分享

2024-03-11 09:29:30 1565

原创 HellaSwag数据集分享

HellaSwag数据集分享

2024-03-10 18:13:24 1778

原创 MATH数据集分享

MATH数据集分享

2024-03-10 18:11:46 1105

AAAI论文下载(从2017起至今)

AAAI的全称是人工智能促进协会(英语:Association for the Advancement of Artificial Intelligence),它是人工智能领域的主要学术组织之一。该组织成立于1979年,原名“美国人工智能协会(American Association for Artificial Intelligence)”,并于2007年更名为“人工智能促进协会(AAAI)”。 它在全球拥有超过6000名成员。 汇集了全球最顶尖的人工智能领域专家学者,一直是人工智能界的研究风向标,在学术界久负盛名。在其早期历史中,该组织由计算机科学领域的著名人物领导,如Allen Newell,Edward Feigenbaum,Marvin Minsky和John McCarthy。 目前的主席是Yolanda Gil。 AAAI是一个非营利科学协会,致力于推动对思想和智能行为及其在机器中体现的机制的科学理解。AAAI为人工智能社区提供许多服务。AAAI每年主办许多会议和研讨会,并为人工智能领域的14种期刊提供支持,旨在促进人工智能的研究和负责任的使用。AAAI还旨在增加公众对

2024-02-28

ICLR论文下载(从2017起至今)

ICLR,全称为「International Conference on Learning Representations」(国际学习表征会议),2013 年5月2日至5月4日在美国亚利桑那州斯科茨代尔顺利举办了第一届ICLR会议。该会议是一年一度的会议,截止到2019年它已经举办了7届,而今年的(2020年)4月26日至30日,将在埃塞俄比亚完成ICLR的第八届会议。 该会议被学术研究者们广泛认可,被认为是「深度学习的顶级会议」。为什么ICLR为什么会成为深度学习领域的顶会呢? 首先该会议由深度学习三大巨头之二的Yoshua Bengio和Yann LeCun 牵头创办。其中Yoshua Bengio 是蒙特利尔大学教授,深度学习三巨头之一,他领导蒙特利尔大学的人工智能实验室MILA进行 AI 技术的学术研究。MILA 是世界上最大的人工智能研究中心之一,与谷歌也有着密切的合作。 Yann LeCun同为深度学习三巨头之一的他现任 Facebook 人工智能研究院FAIR院长、纽约大学教授。作为卷积神经网络之父,他为深度学习的发展和创新作出了重要贡献。

2024-02-26

ICML论文下载(从2017起至今)

「机器学习国际会议(International Conference on Machine Learning 简称:ICML)是机器学习领域领先的国际学术会议」。该会议每年举办一次(会议等级A级)。与NeurIPS和ICLR一起,它是机器学习和人工智能研究领域具有重要影响的三大主要会议之一。它得到了国际机器学习协会(IMLS)的支持。具体日期每年都有所不同,但论文提交一般在1月底到期,会议一般在次年7月举行。 第一届 ICML于1980年在匹兹堡举行。目前已经举办了40届,2024年,第41届ICML即将在奥地利维也纳展览中心举办。具体时间:7 月 21 日星期日至 7 月 27 日星期六

2024-02-26

IJCAI论文下载(从2016起至今)

国际人工智能联合会议(International Joint Conference on Artificial Intelligence, 简称为IJCAI)于1969年成立于加州,它是一个以科学和教育为目的非盈利公司,其主要通过会议记录、书籍、录像和教材的方式传播人工智能在会议上提出了尖端的科学成果。 IJCAI会议是人工智能研究人员和实践者的顶级国际聚会。自1969年以来,IJCAI大会每两年举行一次,在奇数年举行一次,主要由国际人工智能联合会议组织(IJCAI)和东道国国家人工智能学会联合主办。 自2016年以后,该会议开始从每两年举办一次修改成每年举办一次。

2024-02-26

NuerIPS论文下载(从2016起至今)

NeurIPS(Neural Information Processing Systems )是神经信息处理系统会议和研讨会(之前也叫NIPS),每年举办一次。 NeurIPS 会议最初是在 1986 年由加州理工学院和贝尔实验室组织的关于计算神经网络的年度斯诺伯德(Snowbird)会议上提出的。NeurIPS 旨在为探索生物和人工神经网络的研究人员提供一个互补的开放式跨学科会议。NeurIPS 始于 1987 年,信息理论家 Ed Posner 担任会议主席,学习理论家 Yaser Abu-Mostafa 担任项目主席。在早期的 NeurIPS 会议上提出的研究包括范围广泛的主题,从努力解决纯工程问题到使用计算机模型作为了解生物神经系统的工具。从那时起,生物系统和人工系统的研究流开始分化,最近的NeurIPS会议被机器学习、人工智能和统计学的论文所主导。

2024-02-26

EMNLP论文下载(从2016起至今)

Empirical Methods in Natural Language Processing (EMNLP) 是自然语言处理和人工智能领域的顶级会议。在自然语言处理研究领域中,它和Association for Computational Linguistics (ACL) 是两个主要的高影响力会议。 EMNLP 由 ACL 语言数据特别兴趣小组 SIGDAT组织的,每年举办一次。其中SIGDAT(Special Interest Group on linguistic data and corpus-based approaches to NLP )成立于1993年,是ACL成立最久的SIGs(Special Interest Groups)之一。 该资源整理了2016年至今的所有论文,供大家下载学习。

2024-02-26

concrt140d,ucrtbased,msvp140d,vcruntime140d

concrt140d,ucrtbased,msvp140d,vcruntime140d,这四个dll文件的64位,32位的都有。

2018-10-15

双目测量软件+界面显示

其中主要包括视差图的生成,以及将视差点的保存到(.txt)文件中。

2018-10-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除