自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1653)
  • 收藏
  • 关注

原创 AI就业市场疯狂:供需比触目惊心,岗位激增超十倍,应届生年薪160万起,大厂6抢1,你准备好了吗?

深夜的实验室里,计算机专业的博士生李然刚结束与某AI独角兽公司的第三轮技术面试。对方HR在电话里委婉地透露:如果能顺利通过终面,他的年薪 package 将不低于160万元。这不是个例,2025年,一场围绕AI顶尖人才的“军备竞赛”已进入白热化,大模型算法岗位的人才供需比惊现0.17,相当于近6个岗位在争夺1位合格人才。

2026-01-09 09:15:00 1335

原创 2025年AI大模型岗位薪酬Top 20榜单揭晓!详细解读,一篇文章让你尽览行业高薪趋势!

AI高薪岗位榜单:深度学习算法工程师以月薪3.1万居首,架构师紧随其后,机器学习算法工程师月薪2.6万。Python是AI算法工程师首选语言,Go语言和VR开发(如UE4工程师)也是热门方向。生成式AI薪资优势明显,岗位集中在北上广深等一线城市。学习路径需掌握机器学习基础、生成式模型(GAN/VAE)、NLP、计算机视觉等核心技术,熟练使用TensorFlow/PyTorch框架。AI行业人才缺口达400万,建议从工具使用和基础概念入手,避免直接学习复杂理论。

2026-01-09 09:15:00 1043

原创 (2万字硬核长文)大模型强化学习完全指南:从基础到Agentic RL实战技术解析!

本文系统介绍强化学习在大模型中的应用,从基础理论到核心算法(Q-learning、PPO、DPO等),重点解析Agentic RL与LLM-RL的本质区别。强调Agentic RL在多步决策、工具调用中的必要性,并详述Hugging Face TRL、ms-swift等主流框架及业界实践。文章指出,Agentic RL已成为智能体时代的标配技术,能赋予模型自主执行与持续进化能力,是构建复杂AI系统的关键。

2026-01-09 09:00:00 481

原创 通俗解读大模型微调(Fine Tuning)

摘要:本文深入浅出地讲解了大模型微调技术。大模型本质上是处理序列转换的复杂参数矩阵,微调能显著提升其在特定领域的表现。文章分析了微调的必要性,包括降低成本、提高效果、保障数据安全等,并对比了全量微调(FFT)与参数高效微调(PEFT)的优劣。重点介绍了Prompt Tuning、Prefix Tuning、LoRA和QLoRA等主流PEFT方案,其中QLoRA通过量化技术将参数量降低至4bit,大幅减少资源消耗。最后指出AI人才缺口巨大,提供了大模型学习资源包获取方式。

2026-01-09 08:45:00 803

原创 开源版Claude Code大揭秘:客户端如何支持本地大模型?Ollama配置教程,一学就会!

本文介绍了开源版Claude Code的三大优势:开源可修改、支持任意模型、跨平台客户端。重点演示了如何配置本地大模型:通过Ollama启动模型后,创建配置文件指定本地API地址和模型名称,即可在客户端调用。同时推荐了第三方API平台siliconflow,提供多种模型选择。最后指出AI人才缺口巨大,并分享了包含学习路线、面试题等资料的AI大模型学习资源包,适合零基础到进阶的不同人群。

2026-01-09 08:30:00 4

原创 2026新年!普通人逆袭指南:AI产品经理黄金赛道,四步实现月薪36K飞跃!

在这个被焦虑笼罩的技术时代,当程序员们担忧被AI取代时,一个全新的高薪岗位正在悄然崛起:AI产品经理。脉脉数据显示,2025年AI产品经理岗位需求同比增长178%,全国平均招聘月薪达19,459元,而杭州更是以28,659元位居榜首,最高可达36K-45K。更关键的是,这个岗位不要求你懂复杂的数学公式,也不需要你从头训练大模型——它需要的,恰恰是多数产品经理已经具备却未被充分认知的能力。

2026-01-08 09:54:27 444

原创 【AI大模型学习路线图】从入门到实战的全栈指南:大模型AI产品经理学习路线解析!

本文提供了AI大模型从入门到高级的完整学习路线,涵盖Python编程、数学基础、机器学习、深度学习及前沿技术。文章还提供丰富的学习资源,包括路线图、视频教程、技术文档和面试题等。学习AI不仅能提高开发效率和产品质量,还能创造新的商业机会,是程序员不容错过的技能。

2026-01-08 09:15:00 996

原创 【AI智能体框架大比拼】Dify、Coze、n8n等六款热门框架深度评测:哪款最适合你?一文带你全面了解!

本文详细解析了六大火爆AI智能体框架(Dify、Coze、n8n、AutoGen、LangChain和CrewAI),将其分为低代码平台、通用开发框架和多智能体协作框架三类,并从开发门槛、协作能力和工具集成等维度进行对比分析。文章提供了针对不同场景的选型指南,从零基础小白到专业开发者均能找到适合的工具,并介绍了系统学习大模型AI的方法和资源。

2026-01-08 09:00:00 1127

原创 2025年智能体(Agent)全场景应用指南:程序员与企业IT负责人不可错过的必读之作!

本文详细介绍了2025年AI智能体(Agent)的发展现状与选型指南。作者通过实测23款主流产品,提出了选择Agent的三大黄金标准:目标理解能力、跨系统执行能力和安全可控性。按领域推荐了6款顶尖Agent产品,包括企业通用、低代码开发、知识管理、个人生活、开发者和客服场景的解决方案,并提供了实用避坑建议,帮助读者找到适合自己的智能工具,提升工作效率。

2026-01-08 08:45:00 623

原创 【AI模型优化秘籍】大模型LoRA微调显存计算公式揭秘:参数量×2,轻松提升模型性能!

估算方法很简单,就是模型参数量的那个数字乘以2就行了。比如,8B就要16G显存,9B就得18G显存,选显卡量体裁衣就行了。那如果没那么大的显卡也想学微调,也是有办法的,用8Bit或4Bit量化方法装入,分别用原来的一半和1/4就行了。

2026-01-08 08:45:00 435

原创 【2026年AI就业指南】大模型技术演进与核心技能全解析:助你成为AI行业炙手可热的人才!

文章剖析了2025年大模型从对话工具向企业级智能体的技术演进路径,详述了RAG系统、智能体自动化、模型对齐与多模态融合等核心技能。提供了五个实践项目建议,针对垂直领域定制化、多模态技术等趋势给出职业发展指导,为求职者提供全面的技术学习与就业规划。

2026-01-07 18:44:31 917

原创 AI产品经理转型宝典:跟随成功者的脚步,轻松应对时代变革,逆袭成为行业佼佼者!

AI时代已经到来,产品经理需要积极拥抱AI转型。AI不会淘汰产品经理,但会淘汰不会AI的产品经理。转型关键是向已经取得成果的人学习,而非被网络噪音干扰。人人都是产品经理大会是学习AI的绝佳机会,汇集了如腾讯音乐、金山办公等实干家分享AI落地经验,是产品经理把握AI时代机遇的最佳平台。

2026-01-07 18:40:51 385

原创 多Agent系统深度解析:从架构到通信,主流框架与任务调度策略全指南!

文章系统介绍了多Agent系统的概念、架构、通信机制、主流框架、任务调度策略和可靠性保障等内容。多Agent系统通过多个智能体分工合作、协同决策,实现了AI从单点智能到群体智慧的跨越。文章详细分析了AutoGen、CrewAI、LangGraph等主流框架,以及MCP、A2A等通信协议,探讨了任务调度策略和异常处理机制,为构建高效可靠的多Agent系统提供了全面指导。

2026-01-07 18:28:59 520

原创 多模态大模型Qwen3-VL本地部署指南:从零开始,快速上手Qwen3-VL-8B-Thinking模型!

本文详细介绍了多模态大模型Qwen3-VL的本地部署与使用方法,包括模型选择、安装配置、运行参数设置等。重点推荐24G显存下部署Qwen3-VL-8B-Thinking模型,并详细阐述了其视觉编码增强、空间感知、长上下文理解等核心功能。文章提供了完整的安装步骤和运行指南,帮助读者快速上手这一先进的多模态大模型。

2026-01-07 18:21:47 678

原创 AI Agent开发工程师面试难题解析:LangChain与Spring AI的区别与协同!

在AI开发领域,LangChain凭借Python生态的灵活性和快速原型能力成为先驱,适合研究和快速开发。然而,Spring AI在企业级场景中不可或缺,它通过标准化接口、深度集成Spring生态(如依赖注入、可观测性、安全性)以及JVM的稳定性,解决了企业级开发的可维护性、安全性和性能需求。两者的定位差异明显:LangChain适合探索前沿,Spring AI则像工业级生产线,将AI能力无缝融入Java企业架构。

2026-01-07 17:01:18 851

原创 2025年应届毕业生达1222万,2026的AI浪潮下如何打造竞争力,成为破局的关键?

2025 年,高校应届毕业生达 1222 万人,再创新高。千万名 “社会新鲜人” 告别校园步入社会,却要面对双重压力:一是毕业人数攀升,岗位竞争白热化,部分热门行业投递比超 100:1;二是 AI 浪潮重构传统岗位、拔高新兴岗位技能要求,不少学子陷 “所学与所需脱节” 的焦虑。

2026-01-06 16:34:23 1174

原创 2026年程序员转大模型赛道全攻略:职业前景分析,岗位选择指南,助你成功转型!

近年来,AI技术完成了从实验室理论到现实应用的关键跨越,正以“润物细无声”的方式渗透到社会生活的各个角落。从保障出行安全的自动驾驶系统、提升居家体验的智能家电,到助力金融机构防控风险的智能评估平台,AI应用的广度与深度持续拓展。而支撑这些场景落地的核心,正是不断迭代升级的AI大模型——它们如同“智能引擎”,为各类服务与功能提供着底层技术支持。

2026-01-06 16:13:15 332

原创 AI Agent从入门到精通:全流程搭建教程+实战项目,存下吧 很难找全了!

AI Agent能自动执行复杂任务,提升自动化和智能决策效率,是AI产品经理的重要技能提升点。当前就业市场对LLM/Agent/MCP等知识有明确需求。本文提供了Agent搭建全流程学习资料,从基础框架到真实项目实现,帮助学习者掌握核心技术,提升竞争力。可通过微信扫码免费获取完整版学习资源。

2026-01-06 16:11:48 580

原创 斯坦福创新突破:为LLM引入思维流机制,动态修改大模型历史记忆!

斯坦福大学的Thought Gestalt (TG)模型创新性地引入"梯度回传记忆流"技术,使AI能在token层面和句子层面同时建模。通过保留计算图,TG允许未来预测误差反向传播优化过去生成的句子向量,解决了LLM的逻辑一致性和关系方向脆弱性问题。模型将语言转换为紧凑的"思维"存储在记忆中,大幅提高了数据效率,让AI思维不再是黑盒,为实现AGI提供了新思路。

2026-01-06 16:09:56 695

原创 PPO过时了?GRPO/DAPO/GSPO/SAPO四大算法全面对比,揭秘最新强化学习技术趋势!

本文面向已了解强化学习中策略梯度(policy gradient)、优势函数(advantage)、重要性采样(importance sampling)等概念的读者,重点对大模型强化学习主流算法做一条线的梳理与比较。

2026-01-06 16:07:42 447

原创 【3个月转型宝典】失业程序员转行AI工程师:2025年最全大模型学习路线,超详细,不容错过!

结合你的程序员背景和3个月速成目标,我为你设计了一个分阶段的学习路线,重点突出"核心技能聚焦+项目驱动"的学习模式,充分利用你已有的编程优势!

2026-01-05 18:03:48 1271

原创 别慌!35岁+程序员的 Plan B,我整理成了一份生存手册

35岁对于很多职业来说,意味着丰富的经验和更高的薪资。然而,在程序员这个快节奏、高竞争的行业,35岁往往被视为一道门槛,一种“职业生涯的分水岭”。许多人甚至戏称为“35岁魔咒”,认为大龄程序员会面临更高的压力和被淘汰的风险。那么,35岁的大龄程序员在职业生涯中究竟该如何应对这种局面?如何在技术发展迅速、年轻人不断涌入的环境下找到自己的方向和归属?本文将深入探讨35岁大龄程序员的现状、挑战、应对策略以及未来可能的职业方向。

2026-01-05 17:49:50 584

原创 大模型提示词工程入门指南:程序员与小白必备的五大核心技巧与实战案例!

本文介绍了有效使用ChatGPT和大语言模型提示词的五大核心技巧:明确表达需求、提供参考文本、拆分复杂任务、运用角色扮演方法以及系统性测试不同提示词效果。文章通过具体案例展示了这些技巧的实际应用,强调掌握提示词技术对于基于LLM开发应用的重要性,并指出后续将介绍结合API的prompt开发实践。

2026-01-05 17:46:48 987

原创 大模型落地实践指南:推理引擎选型策略与性能优化深度解析!

本文详解大模型推理引擎的核心技术与选型策略,涵盖Transformers、llama.cpp、vLLM等主流引擎的优缺点及适用场景,解析KV Cache、Prefill/Decode等关键概念,提供从个人开发到企业部署的完整解决方案,帮助开发者突破大模型落地最后一公里的性能瓶颈。

2026-01-05 17:45:41 938

原创 一文搞懂RAG:基于LangChain构建大模型问答应用!

本文详细介绍基于RAG(检索增强生成)的大模型问答系统构建方法,涵盖索引(加载、切分、存储)和检索与生成两大核心环节,并展示使用LangChain 1.0的RAG Agent和RAG Chain两种实现方式。文章还提供大模型AI学习系统路径,分为初阶应用、高阶应用、模型训练和商业闭环四个阶段,帮助读者从零掌握大模型技术。

2026-01-05 17:44:03 704

原创 35岁转行AI大模型全攻略:告别中年危机,开启职业新篇章!这份保姆级指南助你少走3年弯路!

据工信部数据,2025年国内大模型相关岗位缺口已达47万,初级工程师平均月薪28K。这不是制造焦虑,而是时代给出的新机遇。

2026-01-04 16:20:24 902

原创 AI大模型面试必备:深入解析LLMs损失函数,10道经典问题助你一臂之力!

文章系统解析了大语言模型中损失函数相关的10道核心面试题,涵盖交叉熵损失、语言建模损失、掩码语言建模等关键概念。详细介绍了不同模型架构(GPT、BERT、T5)使用的损失函数,以及标签平滑、Focal Loss等技术。讨论了损失函数选择对模型训练的影响,类别不平衡处理方法,以及多任务学习中损失平衡的策略。这些内容是深入理解大语言模型训练的基础,对面试和实际开发都具有重要价值。

2026-01-04 16:19:13 738

原创 PPO算法精髓解析:深入探讨Forward KL与Reverse KL散度的差异与选择,解锁大语言模型优化关键!

文章详解PPO算法中KL散度的两种形式:forward KL(mode-covering)和reverse KL(mode-seeking)的数学推导及特性。前者对目标分布小概率事件敏感,后者更关注高概率区域。在大语言模型和生成任务中,反向KL因其生成质量和稳定性更受青睐,是理解PPO算法优化的关键。

2026-01-04 16:06:08 690

原创 大模型训练必看:SFT到RL的完美切换时机,收藏这篇就够了!!

文章解析了大模型训练中从SFT到RL的转换时机与分工。SFT负责"教规矩",RL负责"优选"。当SFT充分但性能瓶颈、有明显提升空间或出现过拟合时,应切换到RL。RL能解决负反馈纠偏、无标准答案任务及追求卓越性能的需求。行业主流实践为冷启动SFT后进行强化学习,再通过循环迭代持续优化。

2026-01-04 16:04:25 684

原创 Dify+Ollama搭建本地知识库完整指南,收藏这一篇就够了!

本文详细介绍了如何使用Dify搭建知识库并接入AI服务,分为两部分:首先部署Dify平台并配置知识库上传功能;然后通过Ollama部署本地Qwen3模型,解决服务监听和模型接入问题。教程提供了完整的安装、配置和调试步骤,帮助读者构建本地AI知识库系统,适合有一定技术基础的开发者实践。

2026-01-04 16:03:02 981

原创 AI智能体长期记忆系统架构设计与实现:打造高效记忆系统!

文章介绍了Zep AI长期记忆系统,通过三层知识图谱架构解决传统RAG系统的局限性。Zep采用双时间轴建模、智能边失效机制和三步走的内存检索技术,能处理动态信息变化,智能判断信息冲突,并提供时间维度理解。文章还详细展示了基于Zep构建AI智能体的技术栈和代码实现方法,使AI智能体能记住并利用长期对话历史,提供更准确、个性化的回应。

2026-01-03 08:30:00 1058

原创 小白也能懂的大模型安全:Agentic AI威胁分类与防御策略全解析(建议收藏)

文章系统分析了Agentic AI的安全威胁,识别出15种核心攻击向量,按推理、记忆、工具、身份和多智能体系统五大层面分类。提出6步诊断框架定位风险,并给出5套防御行动手册,涵盖防止推理操纵、内存投毒、工具滥用等全方位安全策略。通过典型场景分析,强调Agentic AI安全需从认知过程、执行行为和交互网络进行全生命周期治理。

2026-01-03 08:00:00 507

原创 LangGraph长短期记忆管理实践:构建真正智能的AI助手!

本文深入探讨LangGraph框架下的长短期记忆管理机制,详细介绍了短期记忆的存储、修剪、删除和总结策略,以及长期记忆的存储、更新和语义检索方法。通过实战案例,展示了如何构建融合长短期记忆的智能Agent系统,帮助AI实现类人记忆能力,提供更连贯、个性化的交互体验。

2026-01-02 08:45:00 1952

原创 Gemini 3深度解析:2025年AI格局下的最强模型优势与不足!

文章介绍了Google最新发布的Gemini 3模型的核心优势与不足。Gemini 3在推理能力、多模态理解和代码生成方面表现突出,尤其在抽象思考测试和数学竞赛中大幅领先其他模型,能高效处理长文本和复杂图像。然而,在生产级代码编写方面不如Claude稳定,成本较高,图像生成能力也弱于GPT-5.1。文章指出Gemini 3更适合从零开始生成新代码,而Claude更适合长期项目维护,为AI学习者提供了不同模型的适用场景参考。

2026-01-02 08:00:00 827

原创 AI大模型优化全攻略:PEFT技术、推理优化与实施指南,提升效率降低成本!

本文提供全面的AI大模型优化方案,涵盖模型微调(PEFT技术如LoRA/QLoRA/AdaLoRA)和推理(量化、注意力优化、批处理)两大环节。通过系统化应用这些技术,可在保持性能的同时显著降低计算资源消耗,提升训练和推理效率。文章包含实施指南、最佳实践和资源参考,帮助开发者根据实际需求选择合适的优化方案。

2026-01-01 08:30:00 18

原创 AI智能体应用架构设计精髓:深入解读12条核心原则!

AI智能体的本质在于通过结构化指令(Prompt)驱动大语言模型(LLM)完成任务,其核心架构包含四个关键组件:提示词生成JSON指令、Switch语句解析决策、上下文记录执行状态、For循环驱动流程直至终止。文章提出12条设计原则,重点包括:自然语言与工具调用的转换、自主控制提示词和上下文、简化工具设计(JSON结构化输出)、统一业务与执行状态、支持灵活的生命周期管理(启动/暂停/恢复)、通过小型化智能体提升专注度,以及多渠道触发响应机制。这些原则强调对控制流和错误处理的精细管理,确保智能体高效可靠地执行

2026-01-01 08:15:00 210

原创 2026年AI产品经理硬核修炼手册:一套让你少走三年弯路的体系化避坑指南!

优秀的 AI 产品经理需回归产品本质:以用户问题洞察为首要特质,摒弃对确定性的执念、用 “农夫思维” 应对 AI 的概率性与不确定性,同时精准计算 AI 功能的成本与价值,避免为技术而技术,始终将用户需求与商业常识作为核心导向。

2025-12-31 16:37:49 1094

原创 三个月,从零精通大模型:2026版终极学习包(学习路线/笔记/面试),帮你省下80%找资料时间!

我19年入行人工智能 NLP 领域,那时还是传统机器学习/RNN/CNN 的天下。虽然17和18年 Transformer和 Bert 陆续发布,但国内在 NLP 领域的主要应用还是 TF-IDF/Word2Vec/LSTM 为主,实体识别用 CRF,可能现在很多同学都没听过。

2025-12-31 16:33:19 470

原创 【万字长文】人工智能体(AI Agent)开发与应用全景:原理、开发、应用与挑战的全面调研!

本文探讨2023年人工智能体(AI Agent)开发与应用,详细阐述概念、原理、开发、应用、挑战、展望。随着大模型的快速发展,AI Agent具有强大的信息处理与生成能力,能够更好地理解现实世界,处理复杂问题。

2025-12-31 09:45:00 979

原创 Agent Skills:解耦Prompt与执行,实现AI能力模块化工程化!

Anthropic推出的Agent Skills将AI能力从Prompt升级为可管理模块,通过SKILL.md结构化描述能力,采用"索引→选择→按需加载"机制,解决了传统Agent中能力难复用、上下文膨胀等问题。Skill具备可复用、可维护、可共享、可版本化等软件工程属性,实现Prompt负责调度、Skill负责执行的解耦设计,为AI Agent能力工程化管理提供了新范式。

2025-12-31 09:30:00 1506

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除