自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(675)
  • 收藏
  • 关注

原创 All in AI:现在开始,为时不晚!从大模型入门到精通,一篇文章助你实现AI转型,抓住人生新机遇!大模型路线

我的一位开发者朋友最近跟我说:“如果我现在是20岁,我会放下一切 all in 人工智能。”但他已经花了十多年的时间去学习专业知识、积累社交人脉和良好的声誉,已经达到他目前所在领域的最高水平。因此,他现在还得留在原来的领域。另一位较年长的大学时期朋友是一家上市科技初创公司的高管。他对现在的工作得心应手,拥有近乎完美的简历,他之前的职业经历也是令人羡慕的岗位。然而,他现在正在转变方向,因为正如他告诉我的那样,“生命是短暂的”,他不想在结束时想 “如果当时…”。

2025-12-24 11:53:28 237

原创 人工智能工程师初学者指南:从大模型入门到精通的务实学习路线图,一篇文章助你成为AI领域专家!

市面上有无数“人工智能工程师学习路线图”,声称只需几个月就能让你成为人工智能工程师。作为一名在亚马逊(Amazon)从事应用机器学习工作、专注于机器学习基础设施及生成式人工智能内容理解的从业者,我可以负责任地告诉你:要在大型科技公司成为一名人工智能工程师,需要投入大量时间并付出持续的努力。

2025-12-24 11:48:39 58

原创 【干货】微调大模型成本降96%?LoRA技术让个人开发者也能玩转大模型!

本文介绍LoRA技术,一种高效的大模型微调方法。传统全量微调需更新所有参数,消耗大量资源。LoRA通过矩阵分解,用两个小矩阵近似参数改动,仅需学习2%-16%的参数,可降低90%以上成本。这使得个人开发者也能负担大模型微调,并支持同一基础模型搭配不同LoRA"技能包"实现多任务切换。LoRA让大模型微调从大厂专利走向平民化。

2025-12-24 11:47:19 112

原创 AI智能体(Agent)与模型上下文协议(MCP)详解:一篇让你彻底搞懂的文章!

记得GPT刚出来的时候,我们都在研究怎么“提问”。到了今年,我们已经开始研究AI开始“干活”!要把Prompt、Function Calling、Agent和MCP串起来,其实只需要理解一个核心逻辑:如何让AI更精准地执行主人的意图。

2025-12-24 11:43:08 261

原创 大模型智能体开发实战手册:从设计到部署的完整指南,助你轻松构建和扩展AI智能体系统!

文章介绍了AI智能体的设计原则、核心组件和实现方法,包括如何评估适合智能体的应用场景、选择合适的模型、定义工具和配置指令。详细阐述了主管模式和群体模式两种编排架构,提供了代码实现示例,并讨论了多智能体系统面临的挑战及应对策略。最后提出了构建可扩展AI Agent的路线图,从LLM选择到多智能体团队扩展,为开发者提供了全面的指导。

2025-12-24 11:39:54 273

原创 后端工程师的AI转型之路:年薪35万不是梦,AI大模型学习路线与资料全解析!

最近,不少在招聘软件上寻找机会的开发者纷纷表示,后端开发岗位的数量大幅减少,薪资不仅没有往年的涨幅,甚至出现了停滞的情况。更有求职者无奈地分享,自己投递了 70 份后端相关的简历,最终只收到了 3 个面试邀约,而且给出的薪资相比去年同期还降低了 10%,这样的就业现状让不少后端开发者感到焦虑。

2025-12-23 14:15:04 1136

原创 2025年AI薪资内幕曝光:算法岗月薪近7万只是起点,普通人入行的三大黄金路径!

人工智能领域的高薪神话,在2025年不再是秘密。根据国内多家头部科技企业最新的薪酬报告显示,AI技术研发岗的中位数月薪已突破6.5万元,顶尖人才年薪可达200万以上。这样的数字让无数人向往,也让更多人困惑:如此高薪岗位究竟需要什么技能?非科班出身还有机会吗?

2025-12-23 14:10:35 406

原创 AI三驾马车:数据、算力、算法,揭秘它们在人工智能领域的地位与重要性!

人工智能发展的三大核心要素构成铁三角:算法作为思维引擎推动AI能力边界,如Transformer架构带来突破;算力作为能量之源成为国家战略竞争焦点,同时面临环保挑战;数据质量已超越数量成为新焦点,多模态融合与数据安全是未来方向。三大要素协同进化,才能释放AI革命性力量。

2025-12-23 14:08:27 470

原创 从信息检索到智能突破:大模型的bad case解决方案与在线策略蒸馏!

文章探讨了当前大模型面临的bad case问题,指出若不解决底层神经网络问题,大模型将沦为信息检索工具。文章介绍了在线策略蒸馏技术,这是一种结合了强化学习(在线策略)和蒸馏(密集奖励信号)的创新方法。它从学生模型采样轨迹,由教师模型对每个词元进行评分,提供密集反馈,帮助学生模型更有效地学习和避免错误,有望突破当前大模型的技术瓶颈。

2025-12-23 14:05:42 563

原创 不懂SGLang?从miniSGLang开始,轻松入门编程新世界!

SGL社区中推出一款轻量的推理框架:miniSGLang[1],支持完整的LLM推理。用约5千行Python代码和少量c++代码实现,麻雀虽小五脏俱全。相比SGLang上十万行的代码,miniSGLang简单易读,非常适合用于相关概念的理解。

2025-12-23 14:04:28 438

原创 大模型应用开发:为本科生打开AI入行新通道,掌握未来就业市场的关键技能,普通人如何借势突围?

当下,人工智能浪潮正以前所未有的态势席卷全球,以ChatGPT、DeepSeek为代表的大模型技术,不仅在技术层面实现了突破性进展,更在实体经济、文化教育、医疗健康等各行各业掀起变革浪潮。对普通本科生而言,提及转行人工智能,往往会因“技术壁垒高”“专业不对口”等顾虑望而却步。但实际上,若能精准锁定赛道——尤其是大模型应用开发领域,即便是零基础,通过系统化规划与针对性学习,也能打破入行壁垒,在AI领域找到立足之地。

2025-12-22 14:01:31 1112

原创 Java工程师的AI时代新机遇:利用Spring Boot、微服务经验,成为AI落地工程师的黄金指南!

当AI浪潮席卷而来,不少Java工程师陷入了技术焦虑:难道多年的Spring Boot、微服务经验在AI时代一夜归零?事实恰恰相反。2025年,随着大模型技术进入 “工程化落地” 深水区,市场正从狂热追求算法创新,转向扎实的系统集成和业务赋能。此时,Java工程师所擅长的稳健架构、复杂系统集成和工程化思维,成了AI落地中最稀缺、最值钱的能力。

2025-12-22 13:59:22 566

原创 【万字长文】基于 GPU 及 vLLM 的大模型推理加速技术分享:实践与案例,提升AI推理效率的关键!

大模型以其强大的能力在自然语言处理、计算机视觉等众多领域发挥着关键作用。然而,算力资源的稀缺性使大模型推理面临着计算资源难以满足、推理速度慢等挑战,与行业深入应用形成的亟待解决的矛盾,而利用 GPU 进行加速以及借助高效的推理框架如 vLLM 成为了重要的解决方案。本文从GPU通用加速优化技巧和vLLM原理解析出发,随后详细分享了基于GPU和vLLM的推理加速实践及案例,其中有很多值得学习借鉴的经验。

2025-12-22 13:57:42 541

原创 【AI医疗】医疗AI智能体架构全解析:六大核心模块与七种专业智能体类型!

本文提出了医疗AI智能体的六大核心模块框架:感知、对话接口、交互系统、工具集成、记忆学习和推理。通过七种专业智能体类型(如ReAct+RAG、自学习、记忆增强等)的协同配合,构建安全、可解释且自适应的医疗AI系统,推动人工智能从静态模型向具备模块化、可互操作架构的专用临床智能体转变,实现与人类和系统交互、决策和持续改进的能力。

2025-12-22 13:52:32 365

原创 AI Agent:大模型与记忆、规划、工具能力的完美结合,开启AI时代下半场的关键技能!

AI Agent是大模型与记忆、规划、工具能力的结合,实现了从被动响应到主动执行的转变。它解决了普通大模型的知识局限、提示词门槛和任务断裂问题,代表AI应用金字塔的最高层。2025年被视为"Agent元年",AI Agent将承担重复性工作,释放人类创造力,是AI时代下半场的关键技能。

2025-12-22 13:50:45 551

原创 无需智能体框架的智能体式AI:仅靠原生代码与MCP,即可搭建高效AI自动化系统!

最终,我们将以自动化代码评审为典型案例,证明通过分步任务执行的原生代码,结合基于MCP协议的工具调用实现上下文管理(具体为TreeSitter驱动的抽象语法树(AST)解析器),即可构建出真正达到生产级标准的智能体式AI系统。

2025-12-21 09:00:00 524

原创 阿里云AgentRun揭秘:如何让AI Agent轻松跨越生产化鸿沟?企业级AI开发的五大核心能力解析!

文章介绍了AI Agent从原型到生产环境面临的"生产化鸿沟",指出企业级Agent的三大痛点:执行环境复杂、外部依赖不稳定和运行过程黑盒。针对这些问题,阿里云推出AgentRun一站式平台,提供极致弹性、安全沙箱、模型与工具治理、全链路可观测和生态开放五大核心能力,帮助开发者跨越鸿沟,专注于业务逻辑创新,实现AI Agent从Demo到生产部署的平滑过渡。

2025-12-21 08:00:00 765

原创 建筑人AI转型宝典:从土建到AIGC,一步到位的学习路径与实战指南!大模型学习路线

摘要: 随着AIGC技术的爆发式发展,土建行业从业者面临转型机遇与挑战。数据显示,2023年AIGC岗位需求增长近140%,IT/互联网行业占比超60%。AIGC已广泛应用于设计、内容创作、电商等多个领域,为跨行业转型提供可能。建筑从业者可重点关注AIGC设计师岗位,该岗位要求具备设计能力、AI工具使用及模型调优技能。文章还分享了实用AI技巧,如使用Comfyui实现快速抠图和建筑效果图生成,帮助从业者提升效率。面对行业变革,建议建筑人把握AI技术浪潮,通过系统学习实现职业转型。

2025-12-20 17:19:53 972

原创 程序员转行AI训练师,10万月薪已非上限!揭秘2025三大暴利岗位!

脉脉高聘的最新报告揭示了一个令人震惊的现实:2025年1-10月,新发AI岗位量同比攀升543%,单月增幅最高曾超过 11倍。行业薪资结构因此被彻底重塑,AI科学家/负责人的平均月薪突破12.7万元,高薪岗位TOP20的平均月薪全部站上6万元台阶。

2025-12-20 17:18:10 500

原创 企业级RAG检索系统革命!n8n+Ollama+Qwen3强强联合,打造知识库新纪元!

本文介绍了Qwen3-Embedding模型的下载与配置方法,以及Ollama的安装使用指南。主要内容包括:1)Qwen3-Embedding模型在HuggingFace等平台的获取方式;2)Ollama的定制化安装步骤,包括修改模型存储路径;3)解决n8n安装中的常见报错问题;4)两种Qwen3-Embedding模型的测试方法。文章提供了详细的命令行操作和可视化界面配置说明,帮助用户完成本地化部署与测试。

2025-12-20 17:16:06 601

原创 AI应用开发全景图:从LLM到Agent的硬核指南!这些大模型核心概念你必须懂

文章从基础引擎与调校、外部记忆系统(RAG)和智能控制系统(Agent)三层面拆解AI应用开发。通过通俗比喻解释LLM与Token、微调与LoRA、私有化部署、RAG六步原理及Agent的PDEL循环和四大核心能力,帮助开发者从简单API调用升级到设计完整AI应用架构,成为真正的AI应用全栈工程师。

2025-12-20 17:13:09 862

原创 RAG检索增强生成:大模型突破知识局限的核心技术!

检索增强生成(RAG)技术通过连接大语言模型与外部知识库,解决LLM知识时效性不足、易产生幻觉等问题。RAG先检索相关信息片段,再增强提示,让LLM生成更准确、可验证的响应。其进阶形态包括图RAG和智能体RAG,能处理复杂信息整合与验证。RAG广泛应用于企业搜索、客户支持、个性化推荐等场景,是提升大模型实用性与可信度的关键技术。

2025-12-20 17:07:15 877

原创 35+程序员转行大模型月入2万+:2个月零基础入门AI高薪领域的真实经历!!!

我也是他们中的一员。但就在几个月前,我做出了一个改变命运的决定:从传统后端开发,零基础切入大模型领域。仅仅用了两个多月的时间,我就拿到了月薪2万+的大模型应用工程师Offer。今天,我想把这段真实、毫无保留的经历分享给你,告诉你为什么大模型是我们35+程序员逆袭的最佳风口,以及一条已经被验证的、可以“抄作业”的转型路径。

2025-12-19 16:26:40 626

原创 AI Agent学习指南:2025年免费资源汇总,从入门到进阶,建议马上收藏!

文章汇总了2025年最受欢迎的AI Agent免费学习资源,重点推荐Hugging Face的AI Agents课程和DeepLearning.AI的LangGraph短课。这些资源覆盖了从基础到高级的Agent构建知识,包括工具调用、状态管理、多Agent系统等核心概念。所有课程均免费提供,部分可获得认证,适合不同水平的开发者学习,帮助从零开始构建生产级AI Agent应用。

2025-12-19 16:23:29 747

原创 Claude Skills模块化功能架构深度解析:提升AI代理专业能力与任务执行效率的关键!”

Claude Skills是一种模块化功能架构,通过包含指令、脚本和资源的标准化文件夹,使AI代理能够按需加载特定专业知识。其核心特性包括可组合性、可移植性、高效性和执行力。采用渐进式披露机制,仅加载必要信息,突破上下文限制。Skills支持代码执行,确保任务确定性结果,并通过SKILL.md文件和三个子目录组织资源,极大提升了AI代理的专业能力和任务执行效率。

2025-12-19 16:21:51 755

原创 从零开始搭建大模型工作流:本地部署+API调用+开发工具集成!

本文详细介绍如何使用Ollama在本地部署大模型,通过HTTP API将其集成到业务系统,以及在开发工具中应用AI助手。文章提供了本地部署与云端API的混合架构方案,帮助开发者构建自己的AI工作流,实现数据安全、成本可控、离线可用等优势,并包含详细的安装指南和代码示例。

2025-12-19 16:20:31 917

原创 ReAct技术深度解析与大模型应用工程师指南!

ReAct(Reasoning+Acting)是2022年提出的AI范式,通过"思考-行动-观察"循环,使大模型能够链接外部世界并降低幻觉。它包含状态管理、决策引擎和工具调用三大核心组件,解决了模型"只能想不能做"的问题。尽管存在响应时间长等挑战,ReAct已成为事实上的Agent标准,提高了AI产品的可控性。

2025-12-19 16:18:03 527

原创 35岁大龄程序员突破中年危机魔咒:职业转型与个人成长的实用指南!

“中年危机”对于我们当代人来说,是令我们每个人都惶恐不安的四个字,但我们又不得不面对它。对于我们程序员来说尤为明显,就像一个魔咒一样挥之不去。

2025-12-18 16:13:06 519

原创 敢不敢逼自己三个月入门AI?从基础到实战的AI大模型系统学习指南,程序员转型与提升的必藏宝典!

人工智能(AI)特别是大语言模型(LLMs)的浪潮正以前所未有的速度席卷全球,从科研到产业,其影响力日益深远。对于渴望踏入这一前沿领域的学习者而言,一个清晰、高效的学习路径至关重要。本文旨在为您提供一个为期三个月的AI大模型快速学习计划,帮助您从基础概念到实践应用,系统构建知识体系,抓住时代机遇。

2025-12-18 16:09:47 1075

原创 AI智能体记忆系统三维框架:形式、功能与动态机制详解!

本文系统性地综述了AI智能体记忆系统的最新研究进展,提出了"形式-功能-动态"三维分类框架。研究指出记忆是基础模型驱动的智能体的核心能力,支撑长期推理、持续适应和复杂环境交互。文章深入探讨了记忆的三种主要形式(令牌级、参数化、潜在记忆)、三类功能角色(事实记忆、经验记忆、工作记忆)及其演化机制,为未来智能体研究提供了系统性的理论基础。

2025-12-18 16:05:36 767

原创 Dify+LangGraph实战教程:构建企业级多智能体系统的关键技术与方法!

本文介绍了如何将低代码平台Dify与专业编排框架LangGraph结合,构建多智能体系统。文章详细解析了LangGraph的核心特性,如持久化执行、人机交互和完整内存系统,并通过对话分析系统案例展示了"编排代码化,实现可视化"的开发模式。这种融合结合了Dify的低代码优势和LangGraph的强大编排能力,为企业构建高效、可靠的多智能体系统提供了全新路径。

2025-12-18 16:03:46 660

原创 Google Gemini 3 Flash:小身材大能量,开发者必学的大模型性价比之王!

Google发布Gemini 3 Flash模型,以Claude 1/5、GPT 1/4的价格提供了超越旗舰的能力。它在编码、多模态理解和科学推理等基准测试中表现优异,重新定义了"Flash"模型概念。普通用户可在Gemini App免费体验,开发者可低成本部署,为AI应用开发提供极高性价比选择,彻底改变了轻量级模型的定位。

2025-12-18 16:00:00 661

原创 程序员转行大模型指南:2025年最佳时机,抓住这些岗位和选择方法,吃下第一波红利!

模型研发工程师的核心任务是设计和开发新的深度学习模型架构。这包括但不限于研究最新的模型论文,理解并复现复杂的模型结构,以及在此基础上进行创新改进。此外,工程师还需要关注模型训练过程中的性能优化,确保模型在有限的计算资源下达到最佳效果。

2025-12-17 17:28:57 954

原创 2026年AI大模型应用开发保姆级教程:从入门到精通,超详细,这一篇就够了!

截至2025年初,GitHub上基于大模型的开源项目数量已突破17万个,相比三年前增长近20倍。与此同时,中国信通院报告显示,已有68%的企业开始尝试将大模型技术融入业务流程,但其中超过一半因缺乏专业开发人才而进展缓慢。从零开始掌握大模型应用开发,不再是科研团队的专属能力,而正在成为新一代开发者的核心竞争力。

2025-12-17 17:25:21 852

原创 大模型微调完全指南:从理论到LLaMA Factory实战,小白也能轻松掌握!

本文详细介绍了大模型微调的概念、方法和实践流程。首先解释了微调相比完整训练的成本优势,然后介绍了微调的基本步骤。重点讲解了使用LLaMA Factory进行微调的完整过程,包括数据准备、格式转换和图形界面操作。最后说明了如何在Ollama中部署微调后的模型,并通过与RAG技术结合使用,既保证数据新鲜度又确保服务质量。文章为开发者提供了从理论到实践的全面指导。

2025-12-17 17:23:48 848

原创 大模型Memory模块深度解析:从基础实现到高级应用!

文章详细介绍了大模型Memory模块的设计意义与实现方法,包括不借助LangChain的基础记忆实现、自定义Memory模块开发流程、spacy实体识别的高级应用,以及LangChain中七种内置Memory模块的对比分析。文章还提供了从初阶应用到模型训练的完整学习路径,帮助开发者掌握大模型记忆功能的核心技术,实现更智能的对话系统。

2025-12-17 17:19:51 729

原创 深入解析大语言模型技术栈:架构、训练与优化详细指南,掌握未来AI发展的核心力量!

文章主要介绍了大语言模型的技术体系,包括Prefix Decoder、Causal Decoder和Encoder-Decoder三种架构,以及它们在Attention Mask、训练目标和效率上的差异。详细解析了Layer Normalization的不同类型及在LLMs中的应用,探讨了Attention机制的各种变体优化方案。最后分析了LLMs采用Decoder-only结构的原因,以及GeLU、Swish等激活函数的选择与应用。

2025-12-17 17:18:02 727

原创 冲击年薪百万!2026年大厂招聘风向突变:懂大模型的Java工程师正被疯抢!

2025年夏末,阿里巴巴、腾讯、字节跳动等头部科技公司全面升级2026届校园招聘,释放出一个前所未有的强烈信号:纯业务型的Java工程师需求正在萎缩,而掌握大模型能力的“Java+AI”复合型人才,已成为打破薪资天花板、被大厂竞相争抢的核心资产。据人力资源平台调研,大厂对AI类职位的需求量相较往年增长10倍左右,而Java等传统基础技术职位需求则相应大幅下滑。

2025-12-16 15:53:04 1257

原创 2026届秋招AI岗位狂潮:大厂招聘激增10倍,这份成功上岸攻略不容错过!

2025年夏末,一场针对2026届毕业生的AI人才争夺战比往年提前了至少一个月打响。阿里巴巴、腾讯、字节跳动、百度等头部企业纷纷抛出规模空前的招聘计划,其中AI相关岗位占比普遍超过60%,部分业务线甚至高达80%至90%。一场前所未有的秋招正在拉开序幕,机遇与门槛都前所未有。

2025-12-16 15:49:10 578

原创 Claude Skills揭秘:工业级Agent的核心能力与实现原理全解析!

Claude Skills是Anthropic推出的基于文件系统的可复用知识包,通过元数据、指令、资源三要素构成,采用渐进式批露原则分层次加载信息。它为Agent注入流程化、确定性的内部知识(SOP)提供标准化方案,与MCP协同工作,分别提供领域知识和外部工具能力。这种设计使Claude Skills有望成为工业级Agent的标配能力,简化复杂任务处理流程。

2025-12-16 15:43:39 852

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除