自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1633)
  • 收藏
  • 关注

原创 收藏!5分钟彻底搞懂Claude Skills、Projects和MCP的区别与联系

Claude Skills是让人类使用习惯文件化的创新功能,可保存、复用和修改,形成体系化工作规范。不同于一次性提示,Skills能长期调用,让AI从理解指令变成掌握方法。Claude作为"头脑",Skills是做事方法,MCP是工具,Project是任务场景,三者协作实现真正的长期人机协作。Skills让普通人能将"怎么用AI"变成可沉淀的个人资产。

2026-01-08 22:01:21 355

原创 智能体推理范式: Plan-and-Execute(规划与执行)

Plan-and-Execute是一种先规划后执行的任务处理架构模式,适用于复杂任务的分解与管理。它将任务处理分为规划、执行和评估三个阶段:规划器负责将复杂任务分解为有序子任务并确定依赖关系;执行器按计划执行任务,支持并行处理;重规划器在遇到问题时动态调整计划。相比传统ReAct模式,该架构具有全局视野、高效执行、支持并行等优势,能有效解决任务迷失、效率低下等问题。其核心设计包括层次化任务分解、智能调度执行和动态重规划机制,通过结构化流程使复杂任务变得可控有序。

2026-01-07 23:22:24 494

原创 【转型必看】3-6个月成为大模型应用工程师:技术栈学习到项目实战的完整攻略!

本文详细介绍了大模型应用工程师的完整成长路径,包括核心能力定位、技术栈学习、工程化实践和领域应用。强调工程师应聚焦模型落地应用、工程优化和场景适配,而非底层算法创新。提供了从Prompt工程、微调技术到RAG与模型部署的实战指南,以及智能客服、企业知识库等实战项目。通过系统学习,读者可在3-6个月内完成从传统AI工程师到大模型应用工程师的转型,掌握用工具链解决实际问题的核心能力。

2026-01-07 15:27:16 1053

原创 LangChain、LangGraph、LangSmith铁三角:破解LLM工程化三大难题,实战指南详解!

当AI开发者试图将大语言模型(LLM)从实验室Demo推向生产环境时,往往会陷入三重困境:复杂流程设计难:像搭积木却没有说明书——多步骤任务(如"查询订单→验证库存→生成退款")的逻辑分支、循环依赖,用传统代码实现需写大量"胶水代码",稍复杂就变成" spaghetti code"(意大利面代码)。

2026-01-07 15:23:53 430

原创 揭秘大模型两大核心技术:ReAct推理行动与Reflexion自我反思!

本文介绍ReAct和Reflexion两种提升大模型能力的关键提示技术框架。ReAct结合推理与行动,使模型能够与外部环境交互,减少幻觉;Reflexion在此基础上增加评估和反思机制,形成完整学习闭环。两者结合显著提升模型在知识密集型、决策型和编程任务上的表现,为解决大模型事实幻觉、缺乏实时信息、规划能力不足等问题提供了有效方案。

2026-01-07 15:22:05 507

原创 DeepSeek新突破:mHC论文引发AI行业关注,2026年人工智能新篇章的关键推动力!

如今,DeepSeek 又为2026年开了个好头,发布了一篇引人瞩目的新论文《mHC: Manifold-Constrained Hyper-Connections[1]》,该论文目前已引发广泛关注,有望成为2026年下一次重大人工智能突破的关键推动力。论文建立在字节早先一篇名为《Hyper-Connections[2]》的论文基础之上。

2026-01-07 15:20:39 461

原创 前端转AI,别再问行不行了!这是我花三个月整理的技能清单与自学路径,可分享!

文章分析了AI对前端开发的影响,指出AI不会完全替代前端,但会重塑工作价值链。前端开发者应主动向前迈半步,成为半个产品专家,掌握业务知识和提示词工程能力。通过获取业务KnowHow,将提示词视为代码来开发,并用工具证明价值,前端开发者可以在AI时代保持竞争力并实现职业跃迁。转型时机正是现在,不必焦虑,而应主动拥抱变化。

2026-01-06 14:42:13 1415

原创 2026年了!别再自己瞎摸索了!后端转AI的捷径,我都总结在这份避坑指南里了!

文章介绍了AI大模型工程化开发兴起背景,详细列出了大模型应用工程师必备技能,包括Python、深度学习框架、transformer、训练微调流程、RAG技术等。强调最先掌握AI技术者具有竞争优势,并提供AI大模型学习资源,包括思维导图、书籍手册和视频教程,助力后端工程师系统转型。

2026-01-06 14:36:57 539

原创 AI开发必看:为什么有了LangChain,企业级架构师还需要Spring AI?

LangChain作为AI应用开发先驱,具有生态丰富、灵活性高的优势,适合快速原型开发。而Spring AI则专注于将AI能力标准化引入Java企业级开发体系,提供统一抽象、深度集成Spring生态、生产级稳定性和性能。它帮助企业解决供应商锁定问题,实现AI模型可移植性,并与现有微服务架构无缝融合。对于企业而言,Spring AI将AI转化为标准化组件,确保代码可维护性、系统安全性和运行可观测性,是工业级AI应用的首选框架。

2026-01-06 14:33:52 638

原创 AI新手必看:LLM、RAG、MCP、AI Agent四大概念一次讲清!

文章详解AI四大核心概念的区别与联系:LLM是"大脑"提供基础能力,RAG是"记忆"增强特定知识,MCP是"手脚和规则"实现安全操作,AI Agent是整合所有能力的"会自己干活的员工"。这四者层层叠加,共同构成完整的AI应用体系,理解它们的区别对构建实际AI系统至关重要。

2026-01-06 14:30:16 853

原创 AI大模型揭秘:温度系数(Temperature)的作用与影响,带你深入了解AI模型的核心要素!

温度系数是控制大模型生成文本随机性和多样性的关键参数,通过调整概率分布影响输出结果的保守性或创造性。低温(0.1-0.3)产生严谨、确定性的输出,适合事实性问答;高温(>1.0)增加创意但可能降低准确性,适合创意生成。最佳温度需根据任务类型和模型特性通过实验确定,通常从默认值0.7开始调整。温度设置不当会导致输出过于机械或混乱,影响模型性能。

2026-01-06 14:16:41 448

原创 90天AI大模型逆袭之路:非科班出身,我如何靠这套实战方法论甩开同龄人,成功月入25K+

这是2026年发生的真实转型案例,背景非计算机专业的张明并非天才,而是在今年踩准了大模型应用的爆发风口,用一套可复制的 “90天核心能力速成法”,成功切入AI赛道。

2026-01-05 14:51:53 816

原创 2026年AI人才争夺战深度解析:大模型算法岗位月薪5.2W,校招趋势与能力培养收藏版指南!

今年是 AI 应用的元年,自 DeepSeek 的冲击后,全球的 AI 竞赛立即打响,从 Meta CEO 扎克伯格上亿美元争夺 AI 人才起,这股火势已经蔓延至即将到来的 2026 年人才校招,我们来一睹这份最新的校招 AI 人才有什么趋势。

2026-01-05 14:49:31 1245

原创 2分钟速通什么是AI Agent?

开年=,想和大家聊聊“AI agent”的话题。希望小伙伴们阅读后,能有点收获。如果觉得内容还不错,那就点个赞或者“在看”,谢谢啦

2026-01-05 14:48:09 737

原创 2025年大模型技术核心突破深度解析:RLVR、GRPO、推理缩放等进展,干货!

2025年LLM发展呈现推理能力突破,RLVR与GRPO算法引领模型类人思考潮流。架构上MoE层和高效注意力机制成为主流,推理侧缩放和工具调用显著提升性能。开源模型表现亮眼,但基准测试可靠性下降。私有数据成为企业竞争壁垒。未来趋势包括RLVR跨领域应用、文本扩散模型崛起以及本地智能体发展。AI应视为增强人类能力的工具而非替代品。

2026-01-05 14:45:02 808

原创 RAG系统中的“过度检索”问题:探讨引入外部知识可能带来的挑战与解决方案!

本文提出RAGate解决方案,解决传统RAG系统全时检索导致的效率低下与噪声干扰问题。通过门控机制智能判断何时检索外部知识,实现了三种实现方式:提示驱动、参数高效微调和多头注意力机制。实验证明,RAGate-MHA仅需29%的检索量即可获得比100%检索更好的生成质量,同时显著降低计算成本并提高模型置信度,为企业级RAG系统提供了高效实用的优化方案。

2026-01-05 14:43:05 711

原创 AI大模型算法工程师:未来5年的黄金职业!零基础也能成为大师,独家转型秘籍在此,错过等十年!

技术革新的浪潮正在重塑整个AI行业格局。从2023年开始,大模型技术以惊人的速度演进,从单纯的文本理解到多模态交互,从通用模型到行业大模型,技术迭代的步伐不断加快。市场需求爆发式增长。除了传统的互联网巨头,金融、医疗、教育、制造等传统行业都在积极布局大模型。某国有银行技术负责人透露:“我们正在组建30人的大模型算法团队,目标是构建金融领域的专属大模型。”

2026-01-04 14:43:40 956

原创 AI产品经理速成指南:0经验小白如何在2个月内斩获offer?

从还没毕业的迷茫焦虑,到面试多次被拒的灰心,他最终打破0产品经验,0 AI经验求职AI产品岗的地狱开局,最终拿到了AI产品经理offer!如果你也正想要求职产品经理岗,他的经历可能会给你一些启发!

2026-01-04 14:39:06 501

原创 数字化转型深度解析:六大核心维度重构企业价值!

本文从底层逻辑出发,解析企业数字化转型的本质,认为其核心在于实现现实世界与抽象世界的时空统一。文章从连接、数据、智能、组织、架构、价值六个维度,阐述了数字化转型的重构与升级:打破物理限制,将数据从副产品转变为核心生产要素,通过知识沉淀实现智能决策,推动组织向去中心化进化,构建系统性架构支撑,最终实现企业降本增效、体验升级和模式创新,是数字经济时代的生存之道。

2026-01-04 14:37:09 333

原创 AI大模型深度解析:从模型层到产品系统层,全面揭示其工作原理与价值判断框架!

文章从模型层、训练进化方式、生成机制到产品系统层,全面解析AI大模型工作原理。介绍了大模型结构、多模态能力、推理机制、训练流程(预训练、对齐、强化学习)、生成技术(自回归、扩散模型)及产品落地框架(Copilot/Agent、记忆、工具调用、工作流、RAG)。提供判断AI产品价值的终极框架,帮助读者穿透技术迷雾,识别真正有价值的AI产品。

2026-01-04 14:36:10 599

原创 Meta收购Manus:AI Agent如何重塑大数据智能生态?

Meta收购Manus标志着AI Agent时代到来,AI正从能聊天的AI向能办事的AI转变。Manus通过规划、执行、记忆和工具使用四大模块,解决了任务分解、工具调用和结果交付三大核心问题。这种转变重塑了AI价值创造逻辑,从提供信息到提供解决方案,未来将形成多个专业化Agent协作的新生态,对大数据AI行业既是挑战也是机遇。

2026-01-04 14:34:58 972

原创 大模型开发必看:数据质量成新瓶颈,收藏这份高质量数据集构建指南!

文章揭示大模型发展正从"算力为王"转向"数据为后",高质量数据已成为主要瓶颈。作者详细解析了高质量数据集的多维特征(思维链数据、多模态融合等)、不同阶段的数据集类型及质量评估新维度(多样性、真实性、合规性、动态评估)。强调构建高质量数据供给体系对AI发展的重要性,预测2025年数据质量将成为决定AI发展的关键因素。

2026-01-03 11:00:00 452

原创 大湾区青少年AI大赛启示:AI教育转型创造力孵化,跨学科融合解决实际问题!

本文从大湾区青少年AI大赛出发,探讨了人工智能教育转型方向,从技能培训转向创造力孵化,强调跨学科融合和解决实际问题。成功案例表明AI教育需要基础渗透、项目驱动和生态链接的培养体系。未来教育应重构课程、构建"双师型"师资队伍、建立"创造值"评价体系。同时,文章提供了大模型AI学习的四阶段路径,帮助学习者从入门到实战掌握AI技能,把握AI时代的发展机遇。

2026-01-03 08:15:00 579

原创 大模型微调(SFT)实战指南:初学者如何进行大模型微调!

文章总结了微调大模型(SFT)的实战经验,强调先优化Prompt再决定是否微调,准备高质量数据,关注业务指标而非仅看Loss,确保数据多样性和风格统一,通过"堆数据"提高效果,采用从大到小的调参策略,循序渐进学习,以及利用强化学习成果提升SFT效果。同时提供了大模型AI学习的系统路径和资源,适合初学者和希望提升技能的程序员。

2026-01-02 08:45:00 515

原创 大模型RAG架构全解析:8种设计图解与应用场景,助你快速掌握检索增强生成技术!

本文详细解析了RAG的8种架构:简单RAG、多模态RAG、HyDE、校正型RAG、图RAG、混合RAG、自适应RAG和智能体型RAG。每种架构都有其特点和适用场景,从基础的向量检索到复杂的智能体协调。文章还提供了大模型学习路线和资源获取方式,包括入门思维导图、学习手册、视频教程等,帮助程序员系统掌握大模型技术。

2026-01-02 08:30:00 1095

原创 2025年AI开发新标准MCP:6大工具提升开发效率25%-40%,推动AI优先工作流主流化!

2025年AI开发迎来MCP(模型上下文协议)新标准,6大工具显著提升开发效率25%-40%。GitHub MCP Server实现仓库自动化管理,GitMCP降低代码幻觉率70%,Playwright MCP支持浏览器自动化,Memory MCP加速团队协作,Filesystem MCP保障企业文件安全,Fetch MCP优化网页内容获取。这些工具使AI直接连接开发环境,自动化重复工作,改善信息共享。随着50+新工具即将面世、IDE原生集成普及,"AI优先"工作流将成为开发标配,早期采

2026-01-01 09:15:00 716

原创 Prompt Engineer秘籍:打造听话的大模型,长提示词写作方案大揭秘!

你在写prompt时候,是不是总觉得大模型它不听话。要么答非所问、要么一堆废话。扒开思考过程仔细阅读时而觉得它聪明绝顶,时而又觉得它愚蠢至极。明明已经对了怎么又推理到错的地方去了,明明在提示词中提醒过了不要这么思考它怎么就瞎想了。这也许就是每一个Prompt Engineer的困扰。怎么能让模型按照要求去思考。

2026-01-01 08:45:00 545

原创 2025届计算机专业应届生求职秘籍:精准选择算法岗方向,效率超越盲目投简历10倍!

眼下这事儿,说是2025届计算机应届生的“焦虑天花板”,没人会反对——尤其是瞄准算法岗的同学,每天刷招聘软件都像拆盲盒:LLM岗位一堆人抢,AIGC看似好落地却怕“不沾核心”,多模态听着高级又怕太超前。

2025-12-31 14:38:17 940

原创 AI大模型入门指南:30天快速掌握,程序员与小白皆宜的收藏级教程!

你是不是也觉得,AI的浪潮轰隆隆地驶过,别人已经搭上车绝尘而去,而你却还站在原地,连票在哪买都不知道?刷到别人用AI生成的酷炫图片、高效写出的代码、自动处理的数据报告,除了点赞收藏,心里是否也闪过一丝焦虑:“这东西这么牛,我是不是快被淘汰了?”

2025-12-31 14:36:20 1088

原创 深入浅出PPO算法:大模型对齐与质量提升的关键!

文章介绍了PPO(Proximal Policy Optimization)算法在大模型微调中的应用。PPO通过剪切目标函数限制策略更新步幅,采用优势函数估计,平衡训练稳定性和性能提升。算法流程包括采集数据、计算优势函数、优化目标函数和更新策略。PPO具有训练稳定、收敛快等优势,但也面临超参数多、计算资源消耗大等挑战。在大模型微调中,可通过合理选择参数、结合监督预训练、监控训练指标等方法有效应用PPO,确保模型生成更符合人类期望。

2025-12-31 09:15:00 539

原创 AI大模型与垂直行业全解析:绘制人工智能在各行业的应用地图!

文章提供了一个"大模型×行业场景"的应用地图,通过"业务价值×投入成本"框架帮助读者判断AI项目可行性。建议从低价值低投入但有真实用户的小场景起步,积累经验和案例。文章按行业类型分析了AI应用机会,为不同背景的读者提供了实用的AI项目起步指南。

2025-12-31 09:00:00 1222

原创 成立仅9个月就被收购:Meta拿下AI Agent公司Manus,大模型开发者必读(建议收藏)

AI Agent公司Manus从3月成立到12月被Meta收购,创下今年最快收购记录。公司年化收入达1.25亿美元,拥有100万日活用户。收购后Manus将独立运营但技术将整合进Meta产品矩阵,标志着Meta将AI从聊天框转变为实用工具的战略调整,预示AI Agent赛道整合加速。

2025-12-31 08:45:00 680

原创 AI Agent崛起:揭秘新一代数字员工如何引领企业数字化转型,抢占万亿级市场先机!

在过去的两年里,ChatGPT 带动了全球对人工智能的热潮,让无数人第一次感受到机器的“理解力”。然而,当人们还沉浸在“智能问答”的惊喜中时,一种更具颠覆性的存在——AI Agent(智能体),正悄悄进入企业核心系统,成为新一代“数字员工”。

2025-12-30 14:59:22 1422

原创 后端转大模型开发全攻略:Python+RAG+Fine-tuning+Agent技术,从工程化思维脱颖而出(保姆级)

本文详细指导后端开发者转型大模型应用开发,强调工程化思维是后端开发者的核心优势。文章介绍大模型开发需掌握的Python、提示词工程、RAG、Fine-tuning和Agent技术,以及向量数据库知识。通过分阶段学习路线图,帮助后端开发者快速掌握大模型应用开发能力,结合自身业务理解和工程能力,在大模型领域发挥独特优势。

2025-12-30 14:51:49 187

原创 【二万字长文】RAG检索增强生成技术:告别大模型幻觉与过时知识的秘诀!

本文深入解析RAG检索增强生成技术,介绍其基本概念、架构和工作流程,对比稀疏与稠密检索方式,探讨查询重写、结果重排等进阶技术。重点讲解微软Graph RAG实现方法,包括文本处理、图提取、社区创建和多种搜索策略,帮助读者掌握RAG技术,解决大模型知识更新与幻觉问题。

2025-12-30 14:50:26 784

原创 【独家揭秘】最新研究出炉:大模型LLM如何在关键时刻实现深度思考?

文章介绍了MTI框架,一种通过识别并干预LLM推理过程中的"高熵词元"(模型困惑的关键点)来提升性能的方法。该框架采用选择性干预策略,仅在模型不确定性超过阈值时激活,并使用轻量级负向提示指导技术,重用KV缓存降低计算成本。实验证明,这种方法在几乎不增加额外计算开销的情况下,显著提升了LLM在多种推理任务上的准确率,实现了"少即是多"的目标。

2025-12-30 14:29:41 817

原创 彻底搞懂大语言模型(LLM)与Transformer架构的原理与应用!

本文系统介绍了AI大模型家族的核心知识,包括AIGC的两种类型和三个发展阶段,详细解释了机器学习、深度学习和生成式AI的关系,重点阐述了大语言模型(LLM)的定义、特点和技术基础。文章深入剖析了Transformer架构的革命性意义,包括其自注意力机制、编码器-解码器结构、位置编码等关键技术,为读者提供了一条从AI基础到大模型核心技术的学习路径。

2025-12-30 14:26:19 753

原创 Transformer架构核心解析:线性与非线性变换的优雅舞蹈,揭秘模型复杂模式学习能力!

文章解析了线性与非线性变换在Transformer中的应用与价值。线性变换(如矩阵运算、投影)提供结构和参数学习能力,非线性变换(如激活函数、Softmax)赋予模型复杂模式学习能力。两者交替使用的设计使Transformer既保持数学优雅,又能理解现实复杂性,实现层次化特征表示,这种"线性-非线性-线性"的舞蹈是Transformer架构的核心设计哲学。

2025-12-29 15:12:28 670

原创 大模型GRPO训练崩溃原因与解决方法,小白也能轻松掌握!

文章主要探讨了大模型GRPO训练中的崩溃原因及解决方案,包括熵坍塌、重要性权重计算错误、训练推理不一致性、K3估计器偏差、off-policy引入问题,以及Agentic RL特有的Retokenization Drift等。文章提供了相应的解决方法和工程实践经验,强调了在训练过程中平衡探索与利用的重要性。

2025-12-29 15:12:23 454

原创 Java工程师转型大模型开发指南:结合现有技术优势,实现AI落地的关键步骤!

这两年,目睹身边从事 Java 开发的朋友纷纷投身大模型领域,内心感慨万千。回想当初,大家都在专注于写接口、使用 Spring Boot 框架、连接数据库以及配置 Redis,工作生活平稳有序。然而,ChatGPT 的走红让整个后端开发团队陷入了一阵恐慌。每个人都在思考:“我是否需要学习 AI 知识,否则这份工作还能维持多久?”

2025-12-29 15:12:03 1311

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除