码农Q！-优快云博客

原创白话大模型的技术原理

本文系统介绍了大型语言模型（LLM）的技术演进与核心架构。从RNN到Transformer的技术突破，重点解析了Self-Attention机制、多头注意力等关键技术原理。文章阐述了LLM的三大要素：巨量参数、庞大训练数据和强大算力，分析了其理解语法、语义和常识的能力，同时指出了存在幻觉、非即时数据等局限性。最后提供了LLM学习路线和资源，包括商业化方案、视频教程和实战项目，帮助开发者系统掌握大模型应用开发技能。

2025-11-26 21:28:10 776

原创一文搞懂 RAG

本文系统介绍了RAG（检索增强生成）技术的发展与应用。传统RAG通过检索-增强-生成三步骤提升大模型输出的准确性和可靠性，而新兴的AgenticRAG则引入智能体决策机制，使系统能够动态调整检索策略。文章详细对比了两种技术的特点，并提供了Python代码示例展示实现过程。特别强调了2024年以来RAG技术的广泛应用，以及2025年与Agent结合带来的技术突破。

2025-11-26 21:26:22 642

原创让AI“开窍”的艺术：机器学习

机器学习是人工智能的重要领域，通过数据训练让计算机自主获取知识和技能。与传统编程不同，机器学习无需人工制定规则，而是从数据中自动总结规律。主要分为监督学习（带标签数据）、无监督学习（挖掘数据结构）和强化学习（试错优化）三种方式。完整的机器学习流程包括数据准备、模型选择、训练优化、评估测试和部署应用五个步骤，形成"数据训练-反馈调整-实战验证"的闭环系统。

2025-11-26 21:20:26 740

原创最新！大模型架构图对比

【摘要】Sebastian Raschka最新发布的LLM架构对比图显示，当前主流大模型主要采用全量注意力（如DeepSeekV3.1、MiniMaxM2）和混合注意力（如Qwen3-Next、KimiLinear）两种结构。其中KimiK2 Thinking将上下文长度扩展到256k，采用8专家混合结构；Qwen3Next创新性地使用3:1比例的GDN与GatedAttention混合模块；MiniMax-M2则采用分头处理QK正则化。随着AI大模型技术快速发展，掌握LLM相关技能成为程序员提升竞争力的关

2025-11-26 20:51:33 623

原创让全网疯狂的AI神器！它到底有多神奇？

AI大语言模型正引发广泛关注，其基于Transformer架构和深度学习技术，通过海量数据训练获得强大的语言理解和生成能力。目前GPT系列等模型已能完成内容创作、代码开发、知识问答等多种任务。使用技巧包括明确需求、提供上下文、多轮对话和结果验证。未来AI将向更强理解力、多模态融合等方向发展，但不会取代人类，而是成为效率工具。学习大模型需要系统路线，涵盖理论、实战和商业化应用等。

2025-11-25 20:09:06 855

原创 LLM大语言模型的7个致命缺陷！

本文深刻剖析了大语言模型的结构性局限，指出其无法成为"终极操作系统"的七个关键缺陷：1）基于概率压缩的本质导致不可避免的"幻觉"；2）缺乏闭环反馈机制；3）对数字世界底层逻辑的理解不足；4）缺失物理世界的直接感知；5）难以把握社会关系中的主体动机；6）训练数据仅反映"过滤后的现实"；7）记忆系统存在根本性缺陷。作者强调，大模型更适合作为"语言壳层"而非通用智能，未来需要构建包含时空感知、闭环反馈等多层次的综合系统。认清这些边界，

2025-11-25 19:53:08 728

原创面试官问：为什么 RAG 越用越慢？如何反向调优？

摘要：本文探讨了真实业务场景中RAG系统长期运行后性能持续下降的核心原因及解决方案。随着系统运行，主要面临四大性能瓶颈：1）embedding计算量激增导致阻塞；2）向量库规模膨胀拖慢检索；3）重排序模型调用累积延迟；4）LLM生成效率下降。针对这些问题，文章提出系统级优化方案：实施embedding批处理与缓存、向量库分区与定期清理、答案分级缓存、Prompt稀疏化设计等工程手段。特别强调RAG优化本质是链路工程而非模型调优，真实的业务考验的是全链路调优能力，包括缓存体系、异步并发、索引参数等系统性设计。

2025-11-24 19:38:09 671

原创告别LLM黑盒：PyTorch实战，从零构建并训练一个Transformer

本文系统介绍了如何从零开始用PyTorch实现简化版GPT架构。首先阐述了语言模型的本质是预测下一个token的条件概率模型，然后详细解析了Transformer的核心组件：分词、位置编码、自注意力机制、多头注意力和前馈网络。文章提供了完整的代码实现，包括嵌入层、注意力计算、层归一化等关键模块，并讲解了训练过程的数据准备、损失计算和学习率调度。通过逐步构建完整的语言生成系统，帮助开发者深入理解Transformer的工作原理，而不仅仅将其视为黑盒工具。

2025-11-24 19:34:21 1034

原创一文彻底搞懂大语言模型、智能体与工作流

本文探讨了人工智能发展中的三大核心支柱：大语言模型(LLM)、智能体(Agent)和工作流(Workflow)。LLM作为认知引擎，具备强大的语言理解和知识处理能力；智能体通过整合LLM实现自主决策和任务执行；工作流则负责组织和协调多个智能体完成复杂业务流程。三者构成递进协同的技术栈：LLM提供基础认知能力，智能体实现自主行动，工作流实现规模化应用。未来趋势包括智能体专业化协作、工作流动态优化以及三者的深度融合，最终推动"超级自动化"的实现。

2025-11-24 19:28:34 849

原创主流LLM 大模型排行榜介绍

《大模型评测榜单全解析：如何读懂不同排名的玄机？》摘要：当前主流大模型评测榜单各有侧重，LMArena通过用户盲测反映真实偏好，LiveBench每月更新题目避免数据污染，OpenRouter基于API调用量体现市场选择，ArtificialAnalysis综合质量、速度、价格等工程指标，而HuggingFace专注开源模型评估。2025年建议多维度交叉参考：LMArena看用户体验，LiveBench测真实智力，OpenRouter查市场份额，ArtificialAnalysis比性价比，SWE-Benc

2025-11-24 19:26:27 1357

原创深度揭密 AI 私人知识库之一：RAG回答前准备流程

RAG技术突破大模型知识局限，通过检索增强生成实现精准问答。其核心流程包括：1）知识拆解，将文档分割为语义片段；2）向量化编码，使用Embedding模型转换文本；3）向量数据库存储，支持高效语义检索。该技术可应用于企业知识管理、智能客服等场景，解决传统知识检索响应慢、覆盖不全等问题。文中提供了Python实现代码，涵盖文本处理、向量化和检索全流程。RAG技术具有行业普适性，能有效解决企业"知识孤岛"问题，构建智能化的知识管理体系。

2025-11-22 15:55:04 1032

原创 AI产品经理必备技术认知：AI Agent 深度解析

《AIAgent：从工具到智能体的产业变革》 2023年被称为"智能体元年"，AIAgent（AI智能体）的兴起标志着人工智能产业的重大变革。AIAgent已超越传统聊天工具，成为具备自主思考、决策和执行能力的智能系统。其核心特征包括：高度自主性、环境适应力、持续学习能力和协作能力。 AIAgent通过感知、决策和执行三大机制工作：首先感知环境信息，然后综合分析做出决策，最后转化为具体行动并实时调整。按工作模式可分为单Agent、多Agent和混合Agent；按决策方式则分为反应型、目标

2025-11-22 15:52:10 707

原创大语言模型（LLM）训练的三个阶段

本文详细解析了大语言模型（LLM）从基础到成熟的三个阶段训练过程：预训练阶段通过海量文本学习语言规律和世界知识；监督微调阶段通过高质量对话数据学习助手行为模式；强化学习阶段通过自主探索优化问题解决策略。这三个阶段层层递进，共同塑造了现代AI助手的能力。文章还指出LLM存在的局限性，并提供了系统学习大模型的资源路径，包括学习路线、实战项目和面试题等。

2025-11-22 15:48:45 816

原创一文了解：AI框架及其与大模型、数据、算法的关系

人工智能框架是构建AI系统的核心基础设施，主要包括三大类：深度学习框架（如TensorFlow、PyTorch）用于神经网络开发，大数据处理框架（如Spark、Flink）处理海量数据，以及传统机器学习库（如scikit-learn）。这些框架与算法、数据和大模型形成紧密协同关系：框架为算法提供高效实现平台，为数据构建处理管道，并支撑大模型的训练与部署。其中，PyTorch因研究友好成为大模型研发首选，TensorFlow以工业部署见长。现代AI系统运作流程表现为：数据通过处理框架输入，算法在深度学习框架中

2025-11-22 15:47:43 1022

原创全面解析模型微调技术

模型微调是连接通用大模型与垂直领域应用的关键技术，通过针对性参数优化使预训练模型适配专业场景需求。其核心应用场景包括医疗诊断、金融分析等高度专业化领域，以及小样本学习、输出规范定制等特殊需求。技术路径分为全参数微调和参数高效微调（PEFT）两类，其中LoRA、QLoRA等PEFT技术因低资源消耗成为主流选择。标准微调流程包含模型选择、数据准备、训练优化等步骤，需根据任务特点选择合适方法。当前技术仍面临灾难性遗忘、数据依赖等挑战，未来将向高效微调、多任务适配等方向发展，持续推动AI在行业场景的深度落地。

2025-11-20 19:44:47 1076

原创人人都能懂大语言模型-大语言模型怎么训练

本文介绍了大语言模型训练的两个关键概念：Token和训练流程。Token是将文本转换为模型内部编码的基本单位，通过优化Token词表（如GPT-4使用100256个Token）提高编码效率。大语言模型训练分为三个阶段：预训练（Pretrain）使用海量数据学习语言模式，有监督微调（SFT）通过标注数据训练任务能力，强化学习（RL）利用奖励模型优化输出质量。文章还提供了大模型学习资源，包括路线图、教程和实战案例，帮助开发者掌握从基础到应用的完整技能。

2025-11-20 19:42:15 884

原创一文了解大模型应用基本概念

本文介绍了大型语言模型（LLM）及其相关技术。LLM是基于海量数据训练的人工智能模型，能够理解和生成人类语言。文章详细解析了LLM的命名规则（如DeepSeek-V3、通义千问2.5等）、核心概念（Token、参数、蒸馏技术、温度参数），并重点介绍了RAG（检索增强生成）技术，该技术通过检索外部知识库提升模型回答的准确性。此外还涵盖了LangChain开发框架、Function Calling功能调用、MCP协议、向量数据库等技术，展示了如何构建智能Agent平台，结合LLM、RAG和向量数据库解决实际问题

2025-11-20 19:40:46 694

原创 LLM工程技能：提示工程入门

摘要：提示工程是通过优化指令引导基础模型执行特定任务的技术，避免了传统微调的需求。文章探讨了提示的定义、不同类型role提示的实现方式，以及如何通过最佳实践编写有效提示，包括明确指令、角色设定和任务分解等。同时分析了提示攻击的三种类型（提取、越狱、信息泄露）及相应防御措施，如模型强化、抗攻击提示设计和系统隔离机制。研究结合具体API实现和案例分析，为提升大语言模型应用安全性和有效性提供了实用指导。

2025-11-19 19:59:20 888

原创大型语言模型完全指南学习笔记

大型语言模型完全指南学习笔记

2025-11-19 19:57:16 583

原创 Spring AI实现rag流程(简易版)

本文介绍了使用SpringAI技术实现数据向量化存储与检索的方案，基于JDK17和Spring Boot 3.4.5环境。首先通过SpringAI和阿里巴巴AI的依赖管理配置项目，然后配置智谱AI的API密钥和模型参数。核心功能包括：1)数据导入模块，将文本转化为向量存入Redis向量库；2)检索模块，支持相似度查询并返回最相关结果。实现方案采用Redis作为向量数据库，通过RAG(Retrieval-Augmented Generation)技术完成语义搜索，适合构建智能问答等AI应用场景。

2025-11-19 19:49:55 337

原创 AI编程：理解大模型的工作原理

《大型语言模型开发指南》系统介绍了LLM的核心原理与应用方法。主要内容包括：1）LLM工作原理与模型选择策略，强调不同模型适用于不同任务；2）基准测试解读，指出需结合实际需求评估模型能力；3）Cline平台模型选择方法，平衡速度、成本、上下文窗口等关键因素；4）模型提供商路由策略，涵盖直接连接、聚合器和本地部署三种方式。文章还提供了LLM学习资源包，包含经典书籍、行业报告、视频教程等资料，帮助开发者系统掌握LLM技术。通过理解模型差异、合理选择工具，开发者能有效提升AI开发效率。

2025-11-19 19:44:57 950

原创大语言模型（LLM）是什么？

LLM（大语言模型）的本质可以简化为两个核心文件：参数文件和运行代码文件。参数文件存储训练得到的神经网络权重（如Llama2-70B的140GB参数文件），而运行文件（约500行C代码）负责执行这些参数完成推理任务。模型训练是复杂的数据压缩过程，需消耗数百万美元计算资源将互联网文本压缩为模型参数；推理则是参数文件与运行代码交互生成文本的轻量级过程。尽管Transformer架构透明，但参数如何协同工作仍不完全清晰，使LLM成为基于经验验证的"黑箱"系统。模型开发分为预训练（高成本/低频）

2025-11-18 19:26:45 892

原创 Transformer，一个神奇的算法模型！！

摘要：Transformer是一种基于注意力机制的神经网络模型，擅长处理序列数据。它通过编码器-解码器结构，利用注意力得分计算查询、键和值的关系，突破了传统RNN逐步处理的限制。文章以机器翻译为例，展示了PyTorch实现Transformer的基本代码结构，并强调其通过全局上下文理解的优势。

2025-11-18 17:07:41 621

原创 AI 工作流 vs AI 智能体——有何区别?

AI智能体引发科技界热议：从自动化工作流到智能决策摘要：AI智能体正成为科技领域的新焦点，与传统AI工作流相比具有显著差异。传统工作流依赖预设步骤（如请假审批流程），而AI工作流在特定步骤引入AI逻辑辅助决策。真正的AI智能体则能处理开放式场景（如客户支持），通过分析上下文、动态决策和使用工具来解决问题，无需预设流程。这种智能体具备思考、推理和行动能力，可提供更个性化的服务体验。目前已有多个智能体框架（如CrewAI、LangFlow）支持开发，预计未来将在复杂问题解决中发挥更大作用，推动AI向类人思维迈

2025-11-18 17:06:16 868

原创智能体入门：一文速通 LLM

本文系统介绍了大型语言模型(LLM)的核心原理与实用技巧。主要内容包括：1) 语言模型本质是预测下一个词的"句子补全器"，从N-gram到Transformer的进化过程；2) Transformer的核心机制是自注意力，通过QKV三件套实现上下文理解；3) Decoder-Only架构更适合生成任务；4) 提示工程技巧如温度调节、few-shot学习等；5) 分词(token)处理的注意事项；6) 闭源与开源模型的选择建议；7) 模型短板如"幻觉"问题的解决方案(R

2025-11-18 16:57:41 618

原创大模型就是一个数据库么？

大模型不是数据库而是通过学习语言规律生成内容的神经网络。它通过海量文本训练，掌握语义关联而非死记硬背。与数据库不同，大模型通过神经网络参数隐含知识，能根据上下文预测输出。学习大模型需要系统资源，包括专业书籍、行业报告、视频教程等。在AI时代，掌握大模型技术成为职业发展关键，相关学习资料可帮助开发者快速入门。（149字）

2025-11-17 21:31:38 684

原创 LangChain、Dify、Coze…盘点当下最热门的23个开源智能体框架

本文综述了当前主流的开源AI智能体框架技术发展现状，涵盖22个代表性项目。从早期的LangChain、AutoGPT，到企业级方案如Dify、Coze、JoyAgent，再到多智能体系统如MetaGPT、CAMEL，展示了智能体技术从问答工具向任务执行系统的演进路径。文章详细分析了各框架的架构特点、核心技术及适用场景，包括模块化设计、RAG集成、多模态支持、可视化开发等创新点。同时指出未来趋势将向跨框架协作、标准化协议（如MCP、A2A）和全生命周期管理方向发展，为开发者选型提供全面参考。智能体技术正从实验

2025-11-15 16:43:27 1135

原创 AI核心技术关键词：机器学习（深度解读）

AI核心技术关键词：机器学习（深度解读）

2025-11-15 16:38:06 680

原创从Transformer到LLM

大语言模型（LLM）发展与应用综述：从Transformer到现代LLM 摘要：本文系统介绍了大语言模型（LLM）的概念、发展历程和技术原理。LLM作为基于Transformer架构的超大规模神经网络，具有海量参数（千亿级别）和强大的语言理解与生成能力。关键技术突破包括2017年Google提出的Transformer架构，以及后续的GPT、BERT等模型。文章详细解析了LLM的核心技术组件，包括自注意力机制、位置编码和训练范式，并探讨了工程实现中的并行训练和推理优化技术。当前LLM已广泛应用于聊天机器人

2025-11-15 16:33:22 891

原创人工智能之大模型语言LLMs详解

人工智能是模拟人类智能的信息处理系统，其核心在于让机器具备理解、学习和执行语言任务的能力。文章系统梳理了AI发展的三个阶段：从50年代基于规则的语法处理，到统计语言模型，再到当前主流的神经网络模型。重点解析了Transformer架构及其自注意力机制的工作原理，介绍了GPT、BERT等主流大语言模型的技术特点。同时详细阐述了LLM大模型的训练流程，包括数据预处理、预训练、指令微调和对齐优化等关键环节。文章还探讨了Prompt工程技巧及其在教育、医疗等领域的应用实践，并提供了包含书籍、报告和教程的系统学习资源

2025-11-15 16:23:44 630

原创 Context Engineering：机器如何学会“理解“人类意图的熵减史

本文系统梳理了上下文工程（Context Engineering）从Era1.0到Era4.0的演进历程，揭示了其本质是熵减过程——机器越智能，人机交互成本越低。研究指出：理论基础可追溯至1990年代普适计算时代，本质是将高熵的人类意图转化为低熵的机器表示；提出两大设计原则（最小充分性和语义连续性）和分层存储架构（短期/中期/长期），应对上下文生命周期管理；分析Era2.0关键技术（Prompt工程、RAG、工具调用等）及多模态融合策略；展望Era3.0（人类级智能）和Era4.0（超人类智能）将重

2025-11-13 19:23:50 820

原创一文看懂 4 个 AI 核心概念：LLM、Agent、RAG、扩散模型

本文系统介绍了四种主流AI技术：1. 大语言模型(LLM)：基于海量文本训练，擅长语言生成但存在知识固化、幻觉问题，应用场景包括写作、翻译等。2. 智能体(Agent)：在LLM基础上具备记忆、工具调用和自主决策能力，可完成复杂任务如旅行规划。3. 检索增强生成(RAG)：结合实时检索与LLM生成，解决知识更新问题，适用于企业知识库等场景。4. 扩散模型：通过"反向去噪"生成高质量图像/视频，代表作包括Stable Diffusion。文章还提供了LLM系统学习资源包，包含书籍、行业报告

2025-11-13 19:19:58 643

原创一文通关LLM、RAG、MCP、Agent：让AI从“聊天”走向“实干”

这篇文章用通俗易懂的方式解释了当前AI领域的几个关键概念：LLM(大语言模型)是核心"大脑"，具备强大的理解和生成能力但存在知识局限；RAG(检索增强生成)通过外接知识库解决LLM的"幻觉"问题；MCP(模型上下文协议)则是统一工具连接的标准接口；最终Agent(智能体)则整合前三者，成为能自主规划执行任务的"全能打工人"。文章通过生动的比喻和案例，清晰展现了这些技术的关系与价值，帮助读者快速理解AI生态的基本架构。

2025-11-13 19:17:41 960

原创熬夜整理！LLM基础知识汇总~

熬夜整理！LLM基础知识汇总~

2025-11-13 19:13:43 907

原创大白话讲清楚：什么是AI Agent（智能体）

AI智能体正在从"会说话"升级为"会动手"，成为2025年最火技术趋势。这种能自主规划任务、调用工具执行的AI系统，已应用于订票排程、企业报销等场景，通过"感知-规划-记忆-执行"四层架构实现智能决策。未来三年，智能体将重塑80%数字化业务，并向主动预测、物理操控方向发展，同时面临可信治理等挑战，最终可能演变为数字社会的基础设施。

2025-11-12 19:23:33 906

原创 Transformer原理详解（图解版）

摘要：Transformer是2017年提出的具有里程碑意义的深度学习模型，已成为自然语言处理领域的核心技术。其核心创新包括自注意力机制、多头注意力、位置编码和层归一化等。模型由编码器和解码器两部分组成：编码器负责将输入序列转换为连续表示，包含输入嵌入、位置编码、多头注意力等模块；解码器采用自回归方式生成序列，通过掩码机制防止信息泄露，并利用编码器输出辅助预测。该模型通过并行处理和注意力机制有效解决了序列数据的长距离依赖问题，为BERT、ChatGPT等先进模型奠定了基础。 (150字)

2025-11-12 19:22:17 743

原创小白学大模型：从Prompt Caching到Logprobs

本文摘要：文章详细介绍了多种LLM参数及其功能，包括PromptCaching（缓存重复提示以降低延迟和成本）、Seed（确保输出一致性）、LLM Streaming（实时流式传输响应）等核心参数。重点解析了Temperature（控制输出随机性）、TopK/TopP（管理词汇选择范围）、JSON Mode（强制JSON格式输出）等关键参数的工作原理与应用场景。此外还涵盖Function Calling（函数调用集成）、Logprobs（概率分析）等高级功能，为开发者提供了优化LLM性能的全面参数配置指南

2025-11-12 19:18:49 1009

空空如也

空空如也