自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI大模型的博客

取代你的不是AI,而是会使用AI的人 —— 埃隆·马斯克

  • 博客(694)
  • 资源 (1)
  • 收藏
  • 关注

原创 【必学收藏】小白必看:Agent与LLM的区别,一文带你入门大模型智能体

如果说LLM让AI“学会了说话”,那么Agent就是让AI“学会了做事”。它不是取代LLM,而是给LLM赋予了“行动能力”,让人工智能从“屏幕里的问答工具”,变成“融入生活的智能伙伴”。未来,我们不用再适应AI的“规则”,而是AI主动适应我们的需求——这就是Agent最核心的价值。现在,你搞懂Agent和LLM的区别了吗?保证100%免费。

2025-11-24 13:48:53 709

原创 收藏备用!程序员必看:3个月用大模型实现技能跃迁

有人担心“大模型会取代程序员”,但实际情况是:大模型正在淘汰“只会重复编码”的程序员,同时催生了大量“会用大模型提升效率”的新岗位。你不用成为AI算法专家,但必须成为“懂编程+会用大模型”的复合型人才。作为程序员,你有扎实的编程基础、丰富的工程经验,这些都是学大模型的“底气”。从今天开始,花1小时熟悉OpenAI API,用3天掌握LangChain的基础使用,用1周做一个“代码注释生成工具”——你的大模型转型之旅,就从这些小步骤开始。记住:在技术变革的浪潮中,最好的应对方式不是观望,而是主动拥抱。

2025-11-24 13:42:41 698

原创 【涨薪必备】深入解析大模型MoE架构:专家混合模型原理与应用

专家混合(MoE)是一种基于Transformers的高级架构,通过激活少数专业网络(专家)使模型更高效。MoE由专家(轻量级前馈神经网络)和路由器(选择最相关专家)组成。每个输入只使用少数专家,大幅降低计算成本,提升模型容量,并允许不同专家专注于不同任务。这种模块化方法使模型能扩展到数千亿参数,同时保持推理高效,是下一代AI系统的强大工具。每个专家都是一个轻量级前馈神经网络,每次只根据输入选择少数专家。该选择由路由器处理,在推理过程中动态选择每个标记最相关的专家。

2025-11-24 13:41:07 564

原创 【珍藏】AI Agent实战:从零构建企业级Helm Chart自动生成器的架构演进与关键技巧

朋友的复盘里有句话很戳我:“最开始想做‘能自己解决所有问题的 Agent’,后来发现,当前阶段的好 Agent,是‘知道自己不能做什么,且能靠工程弥补’的 Agent。AI-Agent 的落地,从来不是 “让 AI 替代人”,而是 “用 AI 补效率,用工程控风险”,就像这次生成 Helm Chart,AI 负责分析 docker-compose、生成 YAML 片段,工程负责定流程、做校验、补反馈,两者结合才是当前最务实的路径。保证100%免费。

2025-11-23 15:00:00 450

原创 RAG技术全解析:大模型入门到避坑,程序员必备收藏指南

RAG(Retrieval Augmented Generation, 检索增强生成),即LLM在回答问题或生成文本时,先会从大量文档中检索出相关的信息,然后基于这些信息生成回答或文本,从而提高预测质量。图源:网络。

2025-11-23 10:45:00 1044

原创 速藏!大模型学习闭环:小白入门不踩坑,程序员30天练出实战能力

学完Prompt工程还是不会用?”“调通API却做不出完整项目?”“看了无数教程,一到实际问题就卡壳?”很多人在大模型学习中陷入“碎片化学习陷阱”——知识点学了不少,但串不起来,更无法转化为解决问题的能力。真正高效的大模型学习,核心是构建“认知-技能-实战-复盘”的闭环。本文摒弃空泛理论,针对小白和程序员设计“阶梯式实战任务”,从10分钟能上手的小操作,到可写进简历的项目,帮你把知识变成能力,30天内形成稳定的学习节奏。

2025-11-22 14:29:14 692

原创 小白必看!大模型幻觉终结者:RAG技术全解析,建议收藏

想象一下,你正在教一个外星人理解地球语言。这个外星人不懂中文、英文,但它精通数学。你怎么向它解释"苹果"这个词的含义呢?向量的神奇之处就在于:它把人类语言中模糊的、主观的语义概念,转换成了精确的、可计算的数学表示(最终形态是 一个固定长度的浮点数数组)。

2025-11-22 14:28:06 562

原创 【收藏】DeepAgent框架详解:构建具备深度思考能力的AI Agent

DeepAgent将自己定位为,它本质上仍是工具调用循环,但集成了让智能体深度思考的核心能力。与传统框架不同,DeepAgent通过内置工具和能力,让开发者专注于业务逻辑,而非基础设施搭建。字典配置"description":"用于深度研究复杂问题","system_prompt":"你是一个专业的研究助手,擅长多步骤信息收集和综合","model":"openai:gpt-4o",# 可选:覆盖主智能体模型。

2025-11-22 14:25:37 980

原创 【建议收藏】大模型入门到就业:避开95%新人会踩的坑,4个方向精准定位

本文解析了大模型产业链的5个层次,揭示了新人常犯的3大误区,并针对不同背景人群推荐4个发展方向:数据方向(最适合小白入门)、平台方向(程序员最优路径)、应用方向(体现个人技术视野)和部署方向(高门槛但稀缺)。文章提供了三阶段学习路线:认知构建、实战落地和项目打磨,强调"体系与思考方式"比单纯知识点更重要,通过实际项目经验才能在大模型领域获得竞争优势。站在现在回头看,会发现一个有趣的现象: AI 大潮滚滚 2 年,流量的风向能变,岗位的 JD 能变,各家模型能天天更新,

2025-11-21 14:14:44 929

原创 收藏必学!大模型时代AI智能体架构设计的9大核心技术详解

本文详解了AI智能体架构设计的9大核心技术:AI智能体基础架构、Agentic AI多智能体协作、WorkFlow任务流程、RAG检索增强、模型微调、函数调用、MCP协议、A2A智能体通信及AG-UI用户交互。这些技术共同构建了大模型应用落地的完整技术栈,解决了从模型训练到实际应用的各类挑战,为开发者构建高效、灵活的AI智能体系统提供了全面指导。

2025-11-21 14:12:21 1052

原创 大模型应用开发:合同审核Agent实战教程,附完整代码实现(建议收藏)

本文详细介绍了如何使用Dify平台搭建合同审核Agent,解决传统人工审核面临的审核盲区、效率瓶颈和知识断层三大挑战。文章从合同文件处理、要点审核到批注生成三个阶段,讲解了文件格式转换、大模型Prompt设计、审查结果处理和批注插入等技术细节,通过自定义插件和优化大模型应用,实现了合同风险的自动化、标准化与前置化审核。

2025-11-21 14:07:39 1274

原创 【收藏必备】RLFactory:低代码快速训练端到端Agent模型,效率提升2倍+

RLFactory是一个开源的端到端RL后训练框架,通过低代码方式快速训练Agent模型。它解耦环境与训练,只需配置工具和奖励函数,支持异步调用,效率提升2倍+。支持多种奖励计算方式,提供多智能体扩展性。5小时可训练DeepSearch Agent,Qwen3模型无需SFT即可精准调用工具。Deepseek-R1 的成功已经证明了纯 RL 路线的强大潜力,但现有 RL 框架对于工具配置和奖励设计要求较高的工程能力。

2025-11-20 16:15:00 1659

原创 【建议收藏】2025程序员必看:大模型应用开发,百万年薪不是梦!

保证100%免费。

2025-11-20 11:51:46 761

原创 收藏必备:MemOS大模型记忆操作系统,让AI真正“记得住、学得进、更懂你“!

你可以通过提示词工程(Prompt)让模型执行任务,你也可以通过上下文工程(Context)让模型更聪明。但只有拥有记忆(MemOS),它才真正认识你、理解你、陪伴你,并且与你一起成长。智能始于记忆,更成于记忆!MemOS,让 AI 不止回应,还更懂你!

2025-11-20 11:47:03 940

原创 【收藏级干货】检索增强生成(RAG)技术全面解析:2020-2025年高被引研究总结

本文是2020-2025年RAG技术的系统性文献综述,全面介绍了检索增强生成的关键技术组件,包括检索机制、向量数据库、文档分块、编码器、训练方法和生成模型等。文章探讨了创新方法如迭代检索、结构化感知和记忆增强RAG,详述了评估指标和面临挑战,如计算资源权衡、数据噪音、领域漂移和安全风险等。为开发者提供了构建高效RAG系统的全面指南。

2025-11-19 15:45:00 1483

原创 收藏必备!2025年程序员AI大模型转型指南:5条高薪路径,告别35岁危机,薪资翻倍不是梦!

35岁怕被淘汰?AI时代程序员反迎黄金期,解锁这些技能薪资翻番不是空想!"人工智能+"已深度融入国家战略布局,写进政府工作报告的背后,是产业数字化转型的全面提速。在这场技术革命中,程序员群体正站在时代机遇的十字路口——数据显示,AI相关岗位薪资普遍比传统开发岗高出30%-50%,头部AI工程师年薪破百万早已不是行业传说。面对AI浪潮,是驻足观望还是躬身入局?本文为你拆解2025年程序员最值得深耕的5大AI转型赛道,从零基础到技术专家,一步步带你实现职业超车!

2025-11-19 11:16:00 763

原创 收藏必备!从零开始理解大语言模型(LLM)基础原理:一文掌握Transformer与GPU并行训练

神经网络诞生于20世纪40年代,取得重要突破的节点在20世纪70年代、20世纪80年代、21世纪初。20世纪70年代:Paul Werbos博士提出了影响深远的Back Propagation的神经网络学习算法,实际上找到了训练多层神经网络的方法。

2025-11-19 11:10:08 1054

原创 RAG分块策略完全指南:解决大模型幻觉与信息检索难题,建议收藏学习

分块策略优点缺点适用场景固定大小分块实现简单,资源高效语义断裂,信息冗余快速处理非结构化文本语义分块语义完整,检索精准计算复杂,依赖阈值高精度问答、复杂文档递归分块灵活适应长文档,保留结构块大小不均,逻辑断裂风险长篇技术文档、企业报告基于结构的分块逻辑清晰,检索高效依赖格式标准化,预处理复杂结构化文档(论文、白皮书)基于LLM的分块高度智能,适应非结构化文本计算成本高,决策过程不可控非结构化内容、跨领域整合4、RAG分块策略选择建议。

2025-11-18 15:15:00 1005

原创 大模型学习不止于入门:3个成长策略,让你在行业里走得更远

很多人问我:“大模型行业会不会像之前的AI热潮一样降温?现在入行还来得及吗?”我的答案是:“真正的技术革命,从来不是昙花一现,而那些只追风口、缺乏核心能力的人,才会被淘汰。大模型不是“短期风口”,而是“长期趋势”,它正在重构各行各业的技术体系。但这个行业需要的不是“跟风的学习者”,而是“能持续成长的创造者”。不要被短期的技术迭代打乱节奏,也不要因暂时的困难而停滞不前。搭建扎实的底层能力,深耕一个领域,用项目积累经验,用交流拓宽视野——这样的成长路径,无论行业如何变化,你都能站稳脚跟。

2025-11-18 11:06:17 1206

原创 【必学收藏】AI Agent开发框架全面解析:从入门到实战,助你轻松构建智能体

本文介绍了7款主流AI Agent开发框架:LangGraph、AutoGen、CrewAI、OpenAI Agents SDK、Google ADK、MetaGPT和PydanticAI。每个框架都有其独特的设计理念和核心功能,如LangGraph的有状态工作流、AutoGen的多智能体协作、CrewAI的独立高性能框架、OpenAI Agents SDK的极简核心原语、Google ADK的模块化设计、MetaGPT的软件公司角色模拟以及PydanticAI的类型安全。

2025-11-18 11:02:09 783

原创 Agentic RAG技术深度解析:大模型进阶必备,值得收藏的技术指南

RAG技术是人工智能领域的重大突破,它将LLMs的生成能力与实时数据检索相结合。尽管LLMs在自然语言处理领域展现出卓越能力,但由于依赖静态预训练数据,它们的回应常常存在过时或不完整的问题。RAG技术通过动态检索并整合外部信息源的相关内容到生成过程中,解决了这一限制,从而实现了上下文准确且信息更新的输出。Agentic RAG代表了人工智能领域的变革性突破,通过整合自主智能体克服了传统RAG系统的局限性。

2025-11-17 15:30:00 851

原创 大模型微调技术全解析:SFT、ReFT、RLHF、DPO深度对比与实战指南(建议收藏)

四种方法中,ReFT、RLHF 和 RLAIF 都使用了 PPO 作为强化学习算法,区别在于奖励信号的来源不同:ReFT 来自自动化程序的评估,RLHF 来自人类反馈,RLAIF来自AI模型的反馈。只有 DPO 方法使用了监督学习的方式,不采用 PPO 等强化学习算法,而是直接利用人类偏好数据和模型优化模型。那么,为什么 DPO 不用强化学习,而采用监督学习?强化学习方法(如 PPO)需要模型在环境中自行探索,通过试错学习获得奖励信号,这个过程复杂,训练不稳定,且调参困难。

2025-11-17 11:08:12 1047

原创 【深度收藏】大模型技术解析:从基础理论到实战应用,小白到专家的蜕变之路

保证100%免费。

2025-11-16 11:30:00 1292

原创 【必收藏】大语言模型智能体全面指南:从入门到精通

随着人工智能技术的发展,构建通用人工智能成为一个重要目标。通用人工智能需要具备广泛的认知能力,可以感知环境、进行复杂推理、做出判断,并采取行动参与各类任务。近年来,大语言模型的进步为实现通用人工智能带来了希望。它们在语言理解、推理、知识学习等方面表现卓越,被视为通用人工智能的潜在途径。如何在大语言模型的基础上构建真正的智能体,使其具备自动感知环境、推理规划、执行交互等全方位能力是一个关键课题。本文将全面讨论基于大语言模型的智能体相关问题。我们首先阐述智能体的关键属性,分析大语言模型如何满足其需求。

2025-11-16 09:15:00 1627

原创 【必学收藏】RAG 2.0技术深度解析:从挑战到前沿技术,小白也能掌握的大模型检索增强生成指南

过去一年可谓是RAG元年,检索增强生成技术迅速发展与深刻变革,其创新与应用已深刻重塑了大模型落地的技术范式。站在2025年,RAG不仅突破了早期文本处理的局限,更通过多模态融合、混合检索优化和语义鸿沟跨越等突破,开始在各个行业落地。如果把2024之前的RAG称为RAG 1.0,那目前已进入RAG 2.0时代。一个显着的进步是长上下文窗口,这一功能引发了争议,但到年中逐渐平息。很多人觉得长上下窗口就够了,传统的检索和RAG会被取代。

2025-11-14 13:30:00 1617

原创 收藏必学!DeepSearcher大模型实战:从RAG到GraphRAG的升级之路,轻松应对复杂信息检索需求

DeepSearcher 的先进性在于它突破了传统检索和生成的分步模式,深度整合深度学习,优化整个搜索过程。

2025-11-14 10:00:00 1025

原创 【收藏必备】深入浅出RAG:提升大模型性能的检索增强生成技术全解析

保证100%免费。

2025-11-13 13:50:25 821

原创 【必藏】大模型工作原理揭秘:从预测下一个词到智能对话的完整指南

大语言模型本质上是预测下一个词的复杂数学函数,通过处理海量文本数据学习语言规律。预训练阶段使用反向传播算法调整数亿至数千亿参数,使模型具备基础预测能力。随后通过基于人类反馈的强化学习(RLHF)优化,使其成为合格的AI助手。Transformer架构和注意力机制使模型能并行处理文本,关注上下文信息。尽管模型行为难以完全解释,但已能生成流畅自然的回答。

2025-11-13 13:46:50 1086

原创 【收藏必备】从零开始实现RAG检索增强生成:Spring AI构建智能问答系统

RAG(检索增强生成)是一种结合信息检索与文本生成的技术,通过外部知识库动态补充信息,提升大语言模型回答的准确性和时效性。本文详细介绍了如何使用Spring AI框架构建基于本地知识库的AI问答系统,包括环境配置、文档加载、向量存储、查询增强等关键步骤。通过实现文档ETL流程和QuestionAnswerAdvisor拦截器,使AI能够基于特定知识库提供精准回答,有效解决了传统LLM可能产生"幻觉"或提供过时信息的问题。

2025-11-12 14:45:00 1118

原创 深入浅出大模型RAG技术:解决知识局限、幻觉问题的终极方案(建议收藏)

在大型语言模型时代,RAG的具体定义是指在回答问题或生成文本时,首先从大量文档中检索相关信息的模型。随后,它利用这些检索到的信息来生成响应或文本,从而提高预测的质量。RAG方法允许开发人员避免为每个特定任务重新训练整个大型模型。保证100%免费。

2025-11-12 10:38:29 721

原创 AI Agent终极指南:核心机制、主流平台、应用场景全解析(建议收藏)

各大平台均设有官方 GPTs 应用商店,汇聚了丰富多样的插件与模型,能满足用户多元化的需求。这些插件和模型涵盖了从专业领域(如医疗、金融)到日常生活(如娱乐、学习)的各个方面,用户可以根据自己的需求选择合适的应用,扩展 Agent 的功能。单智能体由大语言模型(LLM)、观察(obs)、思考(thought)、行动(act)和记忆(mem)组成。例如,在一个简单的智能问答系统中,LLM 负责理解用户问题并生成回答,观察用户输入,通过思考确定回答策略,执行回答动作,并利用记忆存储和检索相关信息。多智能体。

2025-11-11 14:38:53 905

原创 算力胜人力!大模型时代程序员生存指南,建议收藏

这场裁员潮是商业文明底层逻辑的重构。AI不仅改变工作方式,更重新定义"工作"本身。企业面临生存之战,谁能率先完成"人力驱动"到"算力驱动"的转型,谁就能在未来竞争中占据主动。个人面临危机,去拥抱AI,成为驾驭工具的"超级个体",打造自己的"产品化服务系统",这才是穿越效率革命的唯一出路。未来已来,准备好了吗?

2025-11-11 14:37:22 1099

原创 大模型落地指南:构建企业级AI闭环生产线,收藏级干货

能力层是对外的契约边界:把模型能力通过标准化 API 暴露,明确输入/输出、SLA失败降级策略和成本模型。典型能力包括:文本理解/生成、智能客服、图像识别/生成、视频分析代码生成与智能专家系统。把架构落到执行细节,才能把 AI 的潜力变成商业价值技术框架只是第一步,关键在工程化落地、产品化运营与治理闭环。把算力、模型、平台、能力、应用与治理五层连成一条生产线,把每个模块做成"可注册、可评测、可回滚"的产品,企业才能把 AI 的每次迭代真正转化为业务增长。

2025-11-11 14:36:39 938

原创 字节 / 阿里都在抢!2025 程序员入局 AI 大模型,从入门到突围

在人工智能从"技术概念"转向"产业刚需"的关键节点,大模型已然成为行业竞争的战略制高点。它不仅在医疗、金融、制造等领域掀起效率革命,更给技术从业者开辟了一条宽赛道——这里既有技术迭代的快感,更有职业增值的无限可能。薪资壁垒显著:大模型应用开发、大模型算法优化等岗位的起薪普遍比传统开发岗位高出40%-60%,资深工程师年薪突破百万已成行业常态,薪资增长曲线远快于传统IT领域。职业生命力强劲。

2025-11-10 11:51:29 1033

原创 【必学收藏】高级RAG技术详解:让AI回答更靠谱的10个实战技巧

本文详细介绍了高级RAG技术如何通过优化索引(HNSW算法、语义分块等)、检索(混合搜索、查询重写等)和生成(自动裁剪、重新排序等)环节,解决基础RAG系统中的幻觉问题、领域专一性不足和多轮对话困境等挑战。这些技术能显著提升AI问答系统的准确性、相关性和可靠性,使AI在医疗、教育等领域应用更加可靠实用。

2025-11-10 11:49:47 733

原创 收藏!AI Agent技术全解析:从LLM到智能体开发的实战指南

要说今年上半年科技圈的“网红”,AI Agent(人工智能代理)绝对算一个!笔者最近也紧跟潮流,对这玩意儿进行了深入研究,还用智能体开发平台搞了几个有意思的Agent。今天就来跟大家分享一下,笔者对AI Agent的“独家”理解!保证100%免费。

2025-11-10 11:46:25 1192

原创 重磅!GPT-5正式亮相,AI人才薪资天花板再刷新

AI圈沸腾了!OpenAI官宣的一则消息,直接引爆整个技术领域——,这场技术迭代来得比所有人预期都更快。权威大模型测评平台Artificial Analysis的实时数据已经给出答案:GPT-5一登场就实现弯道超车,直接超越此前稳居榜首的Grok4,强势登顶综合能力榜。更值得国人关注的是,在同期更新的开源模型TOP10榜单中,国产大模型占据六席,从DeepSeek到讯飞星火,中国力量在AI赛道的话语权正不断提升。GPT-5的发布如同导火索,让本就火热的AI赛道彻底进入"加速跑"阶段。

2025-11-08 11:51:29 904

原创 Agentic RAG必学指南:从RAG到AI智能体的融合技术,程序员收藏必备

检索增强生成(RAG),简单来讲,就是将大型语言模型与检索系统融合在一起,让模型在生成回答时,不再仅仅依赖于自身训练所学到的参数,而是能够从外部数据中获取支持,从而使回答更加基于事实。传统的大型语言模型(LLMs)虽然功能强大,但常常会出现一种情况,那就是生成看似合理却与事实不符的回答,这种现象被称为“幻觉”。RAG 通过引入一个外部检索步骤,很好地解决了这个问题。它能够从海量的外部数据中检索并添加事实性或上下文相关的信息。

2025-11-08 11:49:59 876

原创 收藏!从零开始学大模型:LLM基础原理到GPU集群训练全解析(小白友好版)

神经网络诞生于20世纪40年代,取得重要突破的节点在20世纪70年代、20世纪80年代、21世纪初。20世纪70年代:Paul Werbos博士提出了影响深远的Back Propagation的神经网络学习算法,实际上找到了训练多层神经网络的方法。

2025-11-07 14:12:12 641

原创 大模型技术全攻略:从Transformer到Agentic AI,9大核心技术对比与应用(收藏必学)

保证100%免费。

2025-11-07 14:04:41 799

Python学习大纲-为大家学习Python助一臂之力

享学课堂Python学习大纲

2022-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除