自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1305)
  • 收藏
  • 关注

原创 普通人该如何抓住AI大模型的风口?别担心,这篇文章从零开始梳理大模型学习路线,手把手带你入门!

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

2025-12-12 20:46:25 990

原创 从0到1开发一个Agent(智能体)框架

有了基础设施后,我们来看看如何开发一个完整的自定义工具。数学计算工具是一个很好的例子,因为它简单直观,最直接的方式是使用ToolRegistry的函数注册功能。让我们创建一个自定义的数学计算工具。首先,在你的项目目录中创建import ast"""简单的数学计算函数"""return"计算表达式不能为空"# 支持的基本运算# 支持的基本函数try:except:return"计算失败,请检查表达式格式""""简化的表达式求值""""""创建包含计算器的工具注册表"""

2025-12-12 20:44:41 602

原创 一文搞定 AI 智能体架构设计的9大核心技术

与传统的单体 AI 智能体架构不同,Agentic AI 系统架构由多个 AI 智能体组成,这些 AI 智能体能够相互协作,具备动态任务分解、持久记忆和高级任务编排等能力。在Agentic AI 系统中,每个 AI 智能体都有其独特的角色和能力,它们可以相互协作、共享信息,并根据任务需求动态调整策略。随着 AI 智能体在企业中应用越来越广,AI 智能体在落地过程中,MCP 解决了 AI 智能体到 Tools 之间的通信标准,A2A 解决了 AI 智能体到 AI 智能体之间的通信标准。

2025-12-12 20:38:14 817

原创 新项目完结,Ai Agent 智能体、拖拉拽编排!

这是一套基于Spring AI框架实现的企业级AI Agent智能体项目,包含38节视频和文档课程,涵盖RAG、MCP等技术。项目提供完整的前后端+DevOps解决方案,支持可视化拖拽编排,适合开发者快速提升AI应用能力。通过学习此课程,可掌握AI Agent设计模式、Spring AI框架应用、多数据源处理等企业级技能,增强职场竞争力,适合用于简历优化和面试准备。这是一套综合,基于 Spring Ai 框架实现,Ai Agent 智能体。耗时7个多月,38节课程(视频文档。

2025-12-12 20:31:35 617

原创 多模态RAG技术总结及知识图谱构建分割+抽取+验证三阶段思路

RAG作为一种范式,可以灵活扩展,可以来个暴力组合,写综述。变成从文本RAG到多模态输入-文本输出,再到多模态输入-多模态输出的一个演进。这块,看一个技术总结,如《》,https://doi.org/10.36227/techrxiv.176341513.38473003/v2,https://github.com/INTREBID/Awesome-MM-RAG,所有可能使用的模态组合作为输入和输出,包括文本、图像、音频、视频、代码、表格、知识图谱、3D 对象等。一共54个。看几个点。

2025-12-12 20:28:11 749

原创 程序员转行到大模型开发领域,以下是几个推荐的方向、推荐原因以

每个方向都有其独特的挑战和发展机遇,程序员可以根据自己的背景和兴趣选择最适合自己的路径。无论选择哪个方向,持续学习最新的技术和保持对行业的敏感度都是非常重要的。此外,积极参与社区活动、贡献开源项目也是提升技能和个人影响力的有效方式。在大模型时代,我们如何有效的去学习大模型?现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性。

2025-12-12 20:27:23 796

原创 多智能体框架调研:10个主流 AI Agent 框架

本文系统梳理了多智能体框架生态,从学习到生产三个维度分类评估了主流框架。详细分析了Swarm、OpenAI Agents SDK、Qwen-Agent等开发框架,以及MetaGPT、Dify、CrewAI等生产级工具的特点与适用场景,帮助开发者根据需求快速选择最适合的框架,为从入门到生产部署的全流程提供参考指南。Datawhale干货。

2025-12-11 19:22:31 789

原创 字节跳动RAG实践手册

手册涵盖RAG原理、架构设计、数据处理、索引构建、检索策略、生成优化等九大模块,教你如何将"大模型+知识库"打造成工业级产品,实现AI应用"答得快、答得准、答得省"的目标,并提供免费下载PDF和交流渠道。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。方向不对,努力白费。• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

2025-12-11 19:21:31 1047

原创 万字长文:2026年应该了解的20个Agentic AI框架

本文详细解析2026年20个主流Agentic AI框架,包括CrewAI、AutoGen、LangChain等,全面分析各框架特征、优缺点及应用场景。提供按场景分类的选型指南,覆盖多智能体协作、低代码开发、RAG应用等方向,帮助开发者根据需求快速定位适合的智能体解决方案,是AI应用开发者的实用参考资料。全文约1.1万字,阅读时间15分钟文/王吉伟随着AI Agent的落地热潮带来广大企业对于智能体企业级应用的热情探索,更能体现这一阶段AI特征并代表组织战略规划的Agentic AI也就火了。2025年初大

2025-12-11 19:20:34 1042

原创 文档表格带图像、跨页列解析处理及知识图谱缓解RAG内外部知识

本文介绍两大大模型优化技术:一是基于知识图谱解决RAG系统内外部知识冲突问题,通过构建知识图谱、检索核心路径和基于熵值过滤冲突路径,提高大模型回答可靠性;二是多模态文档大模型的表格专项优化,包括表格内嵌图像还原和跨页/跨列表格合并技术,通过视觉一致性强化学习和类型引导表格合并等方法,提升复杂表格解析能力。继续回到RAG和文档智能方向。来看基于知识图谱缓解大模型RAG内外部冲突思路,,最后让只基于靠谱信息说话,其本质上是信息筛选、去噪声的思路。

2025-12-11 19:17:29 681

原创 Agent原理、主流框架、设计模式及应用案例

它秉持线性投资的理念和哲学,专注在技术驱动带来变革的项目,希望帮助创始人找到实现目标的最短路径,不管是行动速度,还是投资方式,Bolt 的承诺是更轻,更快,更灵活。文章详述了反思、工具使用、规划、多智能体协作四大设计模式,以及AutoGPT、HuggingGPT、ChatDev等主流框架,并展示了其在教育、编程、客服等领域的应用案例,为开发者提供了构建AI Agent的全面指导。这个想法的一种自然延伸是,不是单一的代码代理,而是有两个代理,一个是编码代理,另一个是评审代理。

2025-12-11 19:16:30 589

原创 35岁程序员失业后转岗方向:做什么合适?真相可能和你想的不一样

35 岁程序员失业后的转岗方向多种多样,每个方向都有其独特的机遇与挑战。关键在于结合自身优势、兴趣以及市场需求,做出适合自己的选择。无论最终选择哪条道路,保持学习的热情和积极的心态都是应对转型挑战的关键。转型之路或许充满艰辛,但也孕育着无限可能,勇敢迈出第一步,未来或许会柳暗花明。

2025-12-08 15:07:04 1250

原创 程序员失业后不要再去送外卖、开滴滴了,做AI大模型他不香吗?

面对失业,程序员们往往会感到迷茫和不安,尤其是那些在这个行业工作多年却仍感到未能取得满意成就的人。转行似乎是一条艰难的道路,但事实上,除了常见的选择如外卖、跑腿和网约车之外,程序员们还有更多的岗位可以选择。对于那些担心自己在原有行业无法胜任的人,转行并不意味着更大的困难。相反,这可能是一个重新审视自己职业路径和技能的机会。例如,随着人工智能技术的迅速发展,AI大模型等领域为程序员提供了新的职业方向。AI大模型等新兴技术领域的发展为程序员提供了多种职位选择。

2025-12-08 15:05:46 858

原创 大模型推理,不再是“一根筋”

针对DeepSeek这类超大规模MoE模型的多机多卡推理场景中的通信挑战,华为团队提出了三项关键技术:FlashComm技术基于相同的集合通信逻辑替大模型推理中的AllReduce 通信算子,在不改变网络并行方式的前提下,充分利用网络中低维度数据或低比特数据特性进行通信算子位置的编排,实现通信数据量的降低和通信时延的优化,同时消除了计算流程中的冗余计算,进一步提升了网络端到端推理性。

2025-12-04 22:54:29 644

原创 大模型 LLM 架构对比,DeepSeek、Llama、Qwen、Kimi、Mistral、Gemma

同时课程详细介绍了。

2025-12-04 22:52:54 890

原创 大模型相关术语和框架总结|LLM、MCP、Prompt、RAG等核心概念详解

大模型在今年的热度可以说是现象级的。从年初Deepseek ,Manus的爆火出圈到日常app中都能看到大模型的身影。这篇文章我们就来梳理一些关于大模型的术语,包括LLM、MCP、RAG、Agent、LangChain、vLLM、蒸馏等等。

2025-12-04 22:50:46 1077

原创 当红炸子鸡LoRA,是当代微调LLMs的正确姿势?

自 ChatGPT 掀起了大模型(LLM)风潮后,一大波 LLMs(GPT-4, LLaMa, BLOOM, Alpaca, Vicuna, MPT …) 百花齐放。知识问答、文章撰写、代码编写和纠错、报告策划等等,它们都会,也能够交互式地和你玩文字游戏,甚至还有些很有才的朋友将 LLM 作为交互的接口,同时连接到其它各种模态(e.g. 视觉 & 语音)的模型,从而创造了炸裂的多模态效果,炫~!这么炫,难免人人都想打造一个自己专属的 LLM(怎么有种回到了小时候玩宠物驯养游戏的赶脚…)。

2025-12-01 18:40:56 878

原创 面试官问:Agent_的记忆模块是怎么实现的?

记忆模块的核心价值: 让模型具备“长期状态感”,从短期问答进化为真正的 Agent。两类核心机制: 短期记忆保上下文一致性,长期记忆保知识持续性。实现关键: 存储(Vector Store)+ 检索(Retrieval)+ 更新(Summarize)。工程取舍: 灵活与效率、容量与可控之间永远是平衡问题。面试启发: 会讲原理没用,能解释“为什么这样设计”才显得懂工程。

2025-12-01 18:39:25 753

原创 一文搞懂MCP、Function_Calling和A2A

单纯的大模型,只能对话和生成文本,是“思想的巨人,行动的矮子”。配上Agent的大模型,能感知环境、使用工具、执行任务,成为“万能助手”。MCP、Function Calling 和 A2A。这三项技术,并不是有你无我的排斥关系,而是可以通力协作的互补关系。大模型通过 Prompt 学习工具使用,实现非结构化任务处理,克服传统规则的“刚性”,使得AGI(Artificial General Intelligence,通用人工智能)成为可能。

2025-12-01 18:36:51 1030

原创 写给想做大模型算法的你

同时课程详细介绍了。

2025-12-01 18:35:29 943

原创 程序员转行AI大模型必备教程:从入门到精通,手把手告诉你我是怎如何从零基础到高薪就业的

在人工智能(AI)迅速发展的背景下,从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说,这也是一个实现职业转型、提升薪资待遇的绝佳机遇。一、明确大模型概念简单来说,大模型就是具有大量参数和强大计算能力的人工智能模型,可以处理各种复杂的任务,如自然语言处理、图像识别等。想象一下,大模型就像是一个超级聪明的大脑,能够理解和处理各种信息。二、转行步骤第一步:学习基础知识。了解机器学习、深度学习的基本概念和原理,掌握常见的算法和模型架构。

2025-11-26 16:09:24 819

原创 薪资翻倍!普通程序员是如何成功转行大模型?

嘿,各位程序员小伙伴们!大家都知道现在大模型可火了,好多人成功转了行,薪资还直接翻倍,那咱普通程序员能不能也这么牛呢?当然能!首先呢,得把基础知识打牢。啥是机器学习、深度学习,这些都得整明白。可以去网上找些好的课程学学,或者买几本靠谱的书看看。这就像是盖房子得先打地基,基础好了,后面才稳。然后就是多动手实践。找些开源项目跟着做,或者自己试着弄个小模型玩玩。别怕犯错,在实践中才能真正学会那些技术。就像学骑自行车,光看别人骑不行,自己得上去试试。可不能两耳不闻窗外事哦,得时刻关注行业动态。

2025-11-26 16:06:01 570

原创 程序员转行AI大模型教程(非常详细),后端开发转行大模型应用

在人工智能(AI)迅速发展的背景下,从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说,这也是一个实现职业转型、提升薪资待遇的绝佳机遇。前排提示,文末有大模型AGI-优快云独家资料包哦!一、明确大模型概念简单来说,大模型就是具有大量参数和强大计算能力的人工智能模型,可以处理各种复杂的任务,如自然语言处理、图像识别等。想象一下,大模型就像是一个超级聪明的大脑,能够理解和处理各种信息。二、转行步骤第一步:学习基础知识。

2025-11-26 16:04:47 700

原创 2025年零基础转行大模型产品经理必备:从入门到精通全攻略,6个月实现月薪30K+的跃迁之路

同时课程详细介绍了。

2025-11-26 16:02:25 978

原创 2025年最新!后端程序员转行AI大模型学习路线,大模型入门

本文为后端程序员提供AI大模型转型完整学习路径,分基础筑基(1-2月)、核心技能突破(2-3月)和高阶拓展(3-6月)三阶段,涵盖Python强化、RAG系统、Agent开发、提示工程及微调部署等关键技术。文章强调工程化实战,从原型到企业级应用的架构设计,并提供职业发展建议和持续学习方向,助力后端工程师转型AI应用开发,实现薪资提升和职业跃迁。1.1 工程能力的降维打击后端程序员固有的系统架构设计、高并发处理及运维部署经验可直接迁移至AI应用开发:1.2 工具链的快速适配后端开发者的技术栈与大模型开发工

2025-11-26 15:59:33 597

原创 大模型微调训练实践

LoRA(Low-Rank Adaptation)是一种参数高效的微调方法。它的核心思想很简单:冻结原模型参数,只训练额外的小参数矩阵来调整模型输出创建数据处理脚本import os"""处理自我认知数据,替换占位符Args:row: 数据行name: 模型名称 [中文名, 英文名]author: 作者名称 [中文名, 英文名]"""continue# 根据语言标签选择中文或英文continue# 替换占位符return row"""处理自我认知数据集"""

2025-11-22 22:14:05 697

原创 什么是技术架构、数据架构、业务架构、应用架构、产品架构和项目

文章指出项目推进困难的根源在于架构认知缺失,系统梳理了六大核心架构:业务架构、数据架构、应用架构、技术架构、产品架构和项目架构。这些架构构成了一个严谨的决策链条,从定义战略价值到组织人类智慧完成构建,彼此约束又相互滋养。成功的数字化系统需要这六大视角动态平衡、协同演进,帮助各部门有效协作,提高项目可行性和效率。技术团队开发的功能业务方总说不适用;系统随着业务发展变得臃肿难维护;跨部门协作时各说各话,推进困难。这些问题看似毫无关联,但它们都指向同一个根源:对架构认知的片面与缺失。有了对架构的认知,各部门之间就

2025-11-22 22:12:09 868

原创 面试官狂问的28个RAG问题全解析:从基础到架构优化

RAG,全称 Retrieval-Augmented Generation,是一种结合“外部知识检索”和“大语言模型生成”的混合架构。它先从知识库中检索相关文档,再让模型基于这些文档生成回答。

2025-11-22 22:11:05 702

原创 大龄程序员想转行大模型,应该往哪个方向转?_程序员中年失业后,如何选择方向,大模型算法

每个方向都有其独特的挑战和发展机遇,程序员可以根据自己的背景和兴趣选择最适合自己的路径。无论选择哪个方向,持续学习最新的技术和保持对行业的敏感度都是非常重要的。此外,积极参与社区活动、贡献开源项目也是提升技能和个人影响力的有效方式。在大模型时代,我们如何有效的去学习大模型?如果你也想系统学习AI大模型技术,想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习*_,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。

2025-11-21 18:39:19 1405

原创 程序员如何转行大模型?五大热门岗位推荐,IT行业最后的风口就在大模型!错过就难有下次了!

同时课程详细介绍了。

2025-11-21 18:38:11 294

原创 35岁,转行AI正是黄金期!大模型领域机会、学习路径全解析,程序员小白都适用

只要找准定位、敢于行动,中年亦可成为AI浪潮的“弄潮儿”。正如一位成功转型者所说:“

2025-11-18 18:45:35 715

原创 大模型AI Infra方向面试会有哪些经常提问的问题?

同时课程详细介绍了。

2025-11-18 18:33:24 535

原创 激荡三十年:推荐系统从协同过滤到大模型时代

2006-2015年是推荐系统的黄金十年。Netflix Prize将推荐系统推向了学术和工业界的前沿,矩阵分解、隐式反馈、特征工程等技术成为业界标准。这一时期的成果为后续深度学习时代奠定了坚实基础——许多核心思想(如Embedding、特征交互、多目标优化)在深度学习模型中得到了延续和发展。同时,这一时期也暴露了传统方法的局限:手工特征工程费时费力、模型表达能力有限、难以处理高维稀疏数据等。这些问题呼唤着新的技术范式,而答案即将在深度学习时代揭晓。

2025-11-18 18:32:23 500

原创 【AI开源】2B参数多模态大模型Open-Qwen2VL:220小时训练,性能超越闭源,完整开源方案

通过实验证明,基于高效多模态大模型(MLLM)的高质量数据过滤技术和精心设计的数据混合策略,能够在计算资源有限的条件下实现高效预训练,从而开发出具有竞争力的多模态大模型。通过采用多模态序列打包技术和基于平均池化层的动态图像标记数调整,进一步提升了预训练效率。最终开发的Open - Qwen2VL模型在多个多模态基准测试中超越了部分开源的Qwen2 - VL - 2B模型,而其预训练令牌仅为Qwen2VL的0.36%。

2025-11-18 18:31:11 406

原创 2025年了转码,或者转算法工程师还有可行性吗?

*另一个是浙大化工,干了两年工厂,辞职在家自学一年,现在在一家工业AI初创做预测性维护模型的开发,听他说最近刚拿到期权。这点我特别有体会,我有个朋友在做锂电池厂的智能质检,原来也是材料出身,后来转搞图像识别,用AI检测电芯缺陷,现在在一个工业AI公司,年薪比他以前高一倍多,最关键是他说:“我做的东西终于能在工厂落地了,感觉特踏实。说句残酷点的,哪怕你学了一年,最后没进top大厂,但你掌握了算法开发能力、会模型训练和调参**,能独立做小项目,就已经是市面上很多初创公司、工业智能平台在找的人了。

2025-11-18 18:29:51 343

原创 详解Github_35K+项目:打通200+数据源,构建企业

这里把“files”这个数据库中的sales_*questions文件“表”与my_*emb_*openai这个模型”表“进行JOIN,Mindsdb会自动发现两者匹配的”字段“content,并生成向量,然后直接在“my_*chromadb"这个库中创建向量”表“(注意字段名称是强制的),这样就完成了一个向量索引的过程!可以看到,不管底层使用的是自训练ML模型还是外部的LLM,MindsDB都将其统一为SQL可查询的表接口,实现了模型与数据的无缝融合。但不同的是,这里全部是用SQL完成的。

2025-11-17 18:46:28 489

原创 扣子(Coze)实战:篇篇10W+的小林漫画,用Coze实现

同时课程详细介绍了。

2025-11-12 18:56:59 940

原创 新项目完结,Ai Agent智能体、拖拉拽编排!

同时课程详细介绍了。

2025-11-12 18:55:26 885

原创 面试官问:RAG的Query理解模块是怎么做的?

很多人以为RAG的核心是检索或生成, 但真正决定系统表现的,往往是Query 理解的能力。理解得好,后面的检索就像打靶——稳、准、狠。理解得差,模型再强也答不对。“RAG的智能,不在模型,而在解析。在过去的几个月中,我们已经有超过80个同学(战绩可查)反馈拿到了心仪的offer,包含腾讯、阿里、字节、华为、快手、智谱、月之暗面、minimax、小红书等各家大厂以及传统开发/0基础转行的同学在短时间内拿到了各类大中小厂的offer。如果你近期准备转向大模型。

2025-11-12 18:52:16 785

原创 动手学Agent:工具使用(5)MCP工具调用

同时课程详细介绍了。

2025-11-12 18:50:59 394

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除