自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

嘴巴吃糖了

BUG修复中...

  • 博客(1373)
  • 收藏
  • 关注

原创 AI工作流开发神器:扣子(Coze)平台详解,收藏级教程

本文详细介绍基于GUI的AI工作流框架,重点解析扣子(Coze)平台的核心功能和使用方法。文章阐述了工作流框架的类型和优势,通过实例演示如何搭建AI播客工作流,并对Coze、Dify、N8N等框架进行对比。最后展望"工作流即服务"的未来发展方向,鼓励开发者积极拥抱AI工作流框架,提升从创意到上线的全链路效率,实现从离线开发到在线服务的一键式切换。

2025-11-24 19:58:06 707

原创 【干货收藏】大模型智能体实战:从任务决策到ReAct Agent执行的完整开发指南

本文详细展示了一个AI辅助开发助手的完整实现,包括任务决策系统(自动识别不同类型任务)、计划生成(复杂任务拆分)、ReAct Agent执行(基于"思考-行动-观察"循环)以及文件操作、Git集成等工具能力。通过这一系统,大模型从"回答问题"升级为能够"自主规划"和"执行任务"的智能体,显著提升开发效率。

2025-11-24 19:49:39 362

原创 RAG检索优化全攻略:从混合检索到重排序,一篇搞定(建议收藏)

本文探讨了RAG应用中检索策略的优化,指出单一向量检索在处理专有名词和语义否定时的局限性。作者提出采用混合检索(结合向量检索和关键词检索)与RRF算法融合结果,提高召回率;并通过Cross-Encoder重排序模型对候选文档进行精排,提升精度。这种"粗排+精排"的分层架构在法律、医疗、金融等需要高精度检索的场景中尤为重要,是构建高可用RAG系统的关键实践。

2025-11-24 19:40:10 411

原创 大模型微调神器:QLoRA、QA-LoRA、S-LoRA技术详解 | 程序员必学收藏

文章介绍了三种大型语言模型高效微调技术:QLoRA实现在单GPU上微调650亿参数模型;QA-LoRA通过量化感知算法提高计算效率且不损失精度;S-LoRA实现数千个LoRA适配器的可扩展服务。这些技术显著降低显存消耗,提高微调效率,为大规模定制化模型服务提供可能。

2025-11-24 19:31:38 436

原创 【学习收藏】从零到一:AI产品经理——未来5年程序员最值得all in的高薪职业指南

文章指出AI产品经理是未来5年最具前景的职业,将产品经理分为工具型、应用型和专业型三个层次,其中应用型是普通人最可行的方向。提出三步学习法:夯实产品基本功、掌握AI项目落地能力、补充AI知识技能,

2025-11-24 18:48:28 488

原创 【深度收藏】一文详解提示链(Prompt Chaining)核心原理与实战应用,零基础小白收藏这篇就够了!!

提示链是将复杂任务分解为一系列逻辑关联子任务的设计模式,通过多个LLM调用接力处理,提升输出质量与系统可控性。它包括顺序链、分支链、条件链等多种类型,可应用于内容创作、数据分析、软件开发等领域。尽管面临性能开销、错误传播等挑战,但通过验证检查点、结构化输出等策略可有效缓解。提示链作为构建可靠AI应用的基础架构,是企业实现AI深度融入业务流程的关键技术。

2025-11-24 18:31:41 247

原创 程序员必学:AI+医疗技术与应用全解析 | 医学影像、药物研发与智能诊疗实战指南(值得收藏)

AI医疗在全球快速发展,2025年市场规模将达379.8亿美元。中国AI技术在医学影像诊断(准确率96.7%)、药物研发(周期缩短60%)和智能诊疗等领域取得突破。政策支持和市场需求推动产业爆发,但面临数据质量和算法偏见等挑战。未来AI医疗将向"人机协同"方向发展,重塑医疗资源分配格局,中国正走在全球前列。

2025-11-24 11:15:35 453

原创 收藏!2025大模型面试必备:17道RLHF高频题深度解析

本文是2025年大模型面试宝典,重点解析RLHF(基于人类反馈的强化学习)技术。涵盖17个高频面试题及详细解答,包括RLHF原理、训练流程、奖励模型、价值模型等核心概念。特别针对Deepseek等热门大模型,强调MLA注意力、MTP、GRPO等关键技术点。适合准备大厂面试的算法工程师,帮助掌握大模型对齐人类价值观的核心技术,提升面试竞争力。

2025-11-22 19:59:45 793

原创 零基础学Transformer:大模型核心架构详解,值得反复收藏学习

本文详细解析了Transformer架构,这是大语言模型的核心组成部分。文章从NLP基础概念讲起,介绍了词向量嵌入、RNN和LSTM的发展历程,然后深入探讨了Transformer的关键组件,包括输入嵌入、位置编码、多头自注意力机制、残差连接和层归一化等。特别强调了Transformer如何通过并行训练克服传统序列模型的局限性,以及其在自然语言处理领域的重要应用价值。

2025-11-22 19:41:19 590

原创 【建议收藏】大模型提示词完全指南:从基础到实用的7大核心技巧

这篇文章系统介绍了大模型提示词工程的基础知识和实用技巧。阐述了四大原则:语种差异、专一主题、简洁明了和避免歧义。详细讲解了七大实用技巧:角色扮演、提供例子、指定输出格式、限制约束、背景上下文、持续迭代和元提示词。强调随着模型智能化,掌握提示词技巧的人将建立"能力护城河",释放出普通用户难以想象的生产力,帮助更有效地引导AI生成高质量输出。

2025-11-22 15:25:24 366

原创 【收藏必备】小白也能懂的Transformer:NLP发展历程与模型原理解析

文章从NLP发展历程出发,详细介绍了从规则模型、统计方法到神经网络模型的演进过程,重点分析了RNN和LSTM的局限性。然后深入解析了Transformer模型的设计原理,特别是自注意力机制如何解决长距离依赖问题,以及多头注意力机制的优势。Transformer通过并行处理和位置编码,有效克服了传统序列模型的缺陷,成为现代大语言模型的基础架构。

2025-11-22 14:53:52 670

原创 【干货收藏】别再盲目上AI!你的知识库需要先“第二大脑化“

本文指出企业应用AI效果不佳的根本原因在于知识而非AI技术。作者提出"第二大脑化"解决方案:通过PARA系统管理知识、创建原子笔记和建立反向链接,将知识转化为可计算的资产。当知识具备结构、元数据和关系时,AI才能成为高效的复用引擎,而非放大混乱的工具。强调在使用AI前,应先确保知识库可被机器理解,这样才能真正发挥AI的价值。

2025-11-22 14:08:58 847

原创 从提示词到上下文工程:构建高效AI智能体的关键技术(收藏必看)

文章介绍了上下文工程这一提示词工程的演进,关注如何筛选和管理AI智能体的有限上下文资源。探讨了上下文与提示词工程的区别、上下文作为稀缺资源的重要性、高效上下文的构成要素、上下文检索策略及长期任务管理技术(压缩、结构化笔记、子智能体架构)。核心原则是用最小规模的高价值tokens确保预期结果。

2025-11-22 12:00:09 737

原创 【必学收藏】AI产品经理大模型进阶指南,一文吃透RAG:7大核心概念,通俗易懂,零基础小白收藏这一篇就够了!!

本文介绍了RAG(检索增强生成)技术的7个核心概念及其在大模型应用中的重要性。RAG通过信息检索和内容生成结合,有效避免大模型幻觉。文章详解了向量数据库、混合检索、分块嵌入与索引、重排序、上下文融合、准确率与召回率、知识图谱等关键技术,并阐述了RAG系统的运行流程,强调这些技术对提升AI产品经理专业能力的重要性。

2025-11-22 11:41:59 962

原创 小白必学!一文搞懂向量数据库:大模型时代的存储利器,建议收藏

向量数据库是以向量嵌入形式存储非结构化数据的数据库系统,能够捕捉文本、图像等数据的基本特征。通过将数据转换为数值向量,向量数据库实现了高效的相似性搜索、聚类和分类等操作,解决了传统数据库难以处理非结构化数据的问题。在大模型时代,向量数据库成为推荐系统、搜索引擎等应用的核心技术,使用户能够基于语义而非关键词进行数据检索,极大提升了信息处理的效率和准确性。

2025-11-21 20:03:00 832

原创 langchain从入门到精通,大语言模型幻觉现象详解及RAG实战指南,建议收藏!!

大语言模型常出现事实性和忠实性幻觉,主要由数据缺陷、训练过程和推理因素导致。缓解方案包括数据清洗、模型架构改进和检索增强生成(RAG)。RAG通过外部检索权威知识库,使模型能引用最新、准确信息,无需重新训练,经济高效且增强用户信任。RAG流程包括检索相关内容、与用户查询合并为提示词,再由大模型生成响应。

2025-11-21 19:46:46 674

原创 【AI大模型大厂面试真题】腾讯面试官问:动态RAG的数据质量怎么评估?看完这一篇你就知道该怎么回答了!!

本文详细解析了动态增量RAG系统的数据质量评估体系,从可解析性、去重质量、相关性、切片质量和时效性五个维度构建量化评估模型。通过5维综合评分体系实现数据质量监控和异常报警,解决了动态数据不可控、不可预测带来的RAG系统退化问题。这套评估方法不仅是动态RAG系统的核心,也是大厂面试中的高频考点,强调了工程能力而非单一embedding模型对RAG系统成败的关键作用。

2025-11-21 19:26:45 456

原创 【收藏学习】“人工智能+“重构产业格局:企业落地大模型的核心逻辑与实战策略

"人工智能+"与"互联网+"在技术阶段、价值层次和扩散路径上存在显著差异。AI技术仍处快速迭代期,价值层面实现计算增强而非简单连接,扩散路径遵循"生产端到消费端"。企业落地AI需关注应用牵引、模型工程化、数据飞轮和算力云化四大核心逻辑,同时政府应构建包容创新环境,推动数据要素市场建设和行业应用开放,促进AI技术与产业深度融合。

2025-11-21 14:25:50 987

原创 【干货分享】从个人笔记到企业文档:告别关键词搜索,构建精准垂直领域RAG知识库

文章介绍了一种垂直领域RAG系统的构建方法,通过智能菜谱问答助手案例展示了从数据理解、架构设计到工程化挑战的全过程。系统采用四个核心模块,解决了检索粒度、语义检索和用户意图三大工程挑战,适用于任何结构化文档知识库,提供精准检索和完整上下文。

2025-11-21 11:54:49 680

原创 【值得收藏】让AI变靠谱:LangChain多智能体系统HITL人工审核机制实战指南

本文通过智能个人助理示例,详解了如何在LangChain多智能体系统中引入HITL人工审核机制,实现对关键操作的人工干预。结合上下文注入与状态记忆,使系统在保持智能化同时具备可控性、可恢复性和安全性,为构建安全可靠的企业级智能体系统提供了实用模板。

2025-11-21 11:25:40 605

原创 【珍藏必读】Qwen3-VL源码深度剖析:从零开始掌握视觉语言大模型实现

本文详细解析了Qwen3-VL视觉语言大模型的源码实现,从图像预处理、模型入口到视觉编码器,全面剖析了模型如何处理多模态输入。文章重点讲解了Qwen3VLProcessor如何将图像转为pixel_value,Qwen3VLModel如何融合图像和文本特征,以及自研视觉编码器Qwen3VLVisionModel的工作原理,为理解视觉语言模型提供了深入的代码视角。

2025-11-21 11:04:07 841

原创 【值得收藏】大模型文本编码技术深度解析:零成本到高精度的三种实现路径

文章详解大模型文本编码三大技术路线:直接使用预训练模型隐藏状态(零成本但精度不足)、微调编码头适配特定任务(中等投入显著提升精度)、以及针对RAG场景的专门微调(高投入实现最佳检索效果)。三种方式对应不同资源条件和精度需求,是成本与效果的权衡。正确选择文本编码策略能显著提升下游任务表现,决定整个大模型应用的上限。

2025-11-20 19:58:46 548

原创 【必学收藏】构建时序AI代理:优化RAG系统中的动态知识库,零基础小白收藏这一篇就够了!!

文章介绍了如何构建一个时序AI代理系统,用于优化RAG系统中不断演化的知识库。详细描述了从语义分块、原子事实提取、实体解析、时序失效到知识图谱构建的完整流水线。通过LangGraph自动化整个处理流程,实现动态更新知识库,解决事实随时间变化的问题。最终构建了多步检索代理,能够与知识图谱交互,回答复杂的时间敏感问题,提高RAG系统的准确性和可靠性。

2025-11-20 19:47:32 779

原创 【必收藏】多AI-Agents协作实战:Plan-And-Execute模式的工程本质与代码实现

本文深入解析AI-Agent的工程本质,重点介绍Plan-And-Execute模式和多AI-Agents协作机制。通过给大模型添加"工作规则"和"工具",AI-Agent能自主完成任务。多智能体协作解决了单Agent上下文限制、延迟高和稳定性差等问题,实现从"万能助手"到"专业团队"的范式转变。文章通过代码示例展示了AgentPlanAndExecute和AgentReAct的协作过程,强调了专业分工对任务效率的提升。

2025-11-20 19:38:35 971

原创 建议收藏:一文搞懂大语言模型(LLM):小白也能理解的核心原理

大语言模型(LLM)是现代AI应用的核心基础,通过海量文本学习语言规律。其工作原理分为三层:预测下一个词、利用神经网络学习词语关联、通过海量数据和参数记忆规律。虽然本质是概率预测,但通过上下文理解和逻辑推理,能够实现类似人类的"思考"过程,是ChatGPT等AI应用的底层技术。

2025-11-20 14:30:27 626

原创 大模型完全指南:程序员必学技能,从入门到精通,一文看懂大模型热门核心概念:LLM、Prompt、AI Agent、RAG

本文为大模型入门指南,系统介绍大模型基础概念、特点及核心技术。涵盖Prompt工程技巧、AI Agent工作原理及与大模型的关系,以及检索增强生成(RAG)如何解决大模型幻觉问题。内容全面,从基础到进阶,适合程序员及AI初学者系统学习大模型技术,提升AI应用能力。

2025-11-20 11:56:00 684

原创 上不了生产环境的Agent,都是耍流氓式的自嗨!

2025年,很多人都说,是AI Agent的元年。伴随着大模型技术的井喷,我们确实看到了各种各样的Agent实践案例,感觉好像一夜之间,能跟我们对话、帮我们办事的智能体就遍地开花了。但是,在这股热潮背后,其实有一个挺普遍的问题,那就是绝大多数的Agent开发,都存在一种 “重原型、轻生产” 的倾向。

2025-11-20 11:13:28 714

原创 【值得收藏】多模态情感分析实战:LLMs与LMMs的情绪识别技术详解

本文综述了基于LLMs和LMMs的多模态情感分析方法,聚焦于以文本为中心的14种情感分析任务。分析了各类任务的表现特点,探讨了LLMs在多模态情绪识别中的优势与挑战,包括零样本学习能力。文章还展望了该技术在智能伴侣、客户服务等领域的应用前景,为研究者提供了全面的技术参考和未来研究方向。

2025-11-20 10:24:44 858

原创 【珍藏版】RAG技术入门:为什么你的大模型需要它?(附工具实操)

RAG(检索增强生成)通过数据准备(文档切片、向量化、存储)和数据使用(问题匹配、上下文拼接)两个阶段,实现语义层面的知识检索,解决大模型缺乏特定领域知识的问题。它能弥补"缺数据"痛点,但存在数据质量、嵌入模型性能等问题,可通过优化策略和先进框架如Advanced RAG、HybridRAG等提升效果。

2025-11-19 16:37:42 588

原创 【必学收藏】用AI解决物流难题:基于大语言模型的车辆路径规划智能体框架实战

本文提出AFL多智能体框架,通过大语言模型解决复杂车辆路径规划问题。框架将流程拆分为三个子任务,由四个专用智能体(生成、判断、修订和错误分析)协作实现全自动化。在60种VRP任务测试中,代码可靠性达100%,方案可行性接近100%,性能媲美专业算法,显著优于其他LLM方法,为物流配送等场景提供高效自动化解决方案。

2025-11-19 16:22:24 812

原创 【必收藏】大模型微调全攻略:从入门到精通的5种方法详解,助你打造专属AI助手

文章详细介绍了大语言模型的五种主流微调方法:全量微调、Adapter、LoRA/QLoRA、前缀微调及指令微调。每种方法都涵盖原理、代码实例和优缺点分析。提供了方法选择指南,帮助读者根据资源需求和任务特点选择最适合的微调策略,特别推荐从LoRA/QLoRA开始,因其性价比高且能达到接近全量微调的效果。

2025-11-19 15:37:40 572

原创 收藏!一文读懂LoRA:大模型高效微调的数学本质与实现机制

LoRA技术通过低秩矩阵分解实现大模型高效微调,将全秩权重更新矩阵ΔW分解为两个低秩矩阵A和B的乘积,参数压缩比达256:1。训练时冻结原始权重,仅优化A和B矩阵,推理时合并至原始权重不增加延迟。该技术灵活应用于Transformer的MHA/FFN层,适用于各种模型结构,是降低大模型微调成本的关键技术。

2025-11-19 14:54:11 804

原创 【必看收藏】微软R&D-Agent-Quant:用AI驱动量化投资研发,大模型赋能自动化策略全流程

微软亚洲研究院推出R&D-Agent-Quant,以"用AI驱动AI"理念构建智能量化研发体系。系统包含规范、构思、实现、验证和分析五大功能单元,实现从假设生成到策略回测的全链路自动化。通过因子-模型协同优化机制,在实验中展现出效率、稳健性与收益表现的显著优势,使用因子数量减少70%以上同时提升性能。相关代码已在GitHub开源,论文被NeurIPS 2025接收,为量化投资提供了智能化新方向。

2025-11-19 11:57:48 923

原创 大模型必备技能:RAG技术详解,让AI回答更准确、可追溯(收藏学习版)

文章详解RAG(检索增强生成)技术,通过"先检索后生成"的机制解决AI"幻觉"问题。RAG让AI在回答前从可靠知识库获取信息,具备知识实时更新、回答可追溯、降低幻觉风险等优势。已在金融、医疗、客服等领域广泛应用,未来将向多模态检索、智能知识库管理等方向发展,使AI成为更可靠的知识助手。

2025-11-19 11:44:45 637

原创 AI时代需求编写指南:如何编写让AI也能看懂的高质量需求(必学收藏)

文章讨论了在AI参与代码生成时代,需求必须具备更高标准的关键特质。重点阐述了三个核心特质:文档化(需被明确记录成为AI可直接使用的输入)、正确性(确保需求准确无误,避免"垃圾进,垃圾出")和完整性(包含所有必要细节如边缘情况、错误处理等)。这些特质是确保AI能正确理解需求并生成符合项目约束代码的基础。

2025-11-19 10:38:04 856

原创 2026年AI必备技能:从提示词到智能体,掌握这9大核心能力,收藏学习!

文章指出2026年AI技术将进入"驾驭"和"构建"阶段,职场需掌握九大核心技能:精准交互与多模态理解、RAG与微调、自动化与智能体、创意与管理。这些技能将帮助人们从AI使用者转变为"智能编排者",通过整合模型、数据与工作流,在智能时代掌握主动权,成为定义未来的创造者。

2025-11-18 15:24:07 250

原创 收藏必备:AI编程革命 - 从高级插件到自治执行体的范式转移

AI编程正从辅助工具转变为具备自治能力的执行体(Agent),引领软件工程进入"提示驱动开发(PDD)"范式。开发者角色从"写代码"转变为"设计规则和提示",未来软件研发将由架构师指挥Agent协作完成。文章系统分析了Agent发展的六个维度,强调AI不是取代人类,而是增强人类,让开发者成为更高维度的设计者与指挥者。

2025-11-18 15:11:52 244

原创 【必学收藏】模块化RAG架构:大模型检索增强生成新范式,看到就是赚到,建议收藏!!

文章介绍了模块化检索增强生成架构(Modular RAG)的设计理念与结构,将复杂RAG系统拆分为三层架构:顶层(关键阶段管理)、中层(子模块)和底层(操作符)。详细阐述了索引、检索前优化、检索等核心模块的功能与优化方法,包括块优化、查询扩展、稀疏/稠密/混合检索等技术。这种模块化设计提高了RAG系统的可扩展性、可维护性和性能,为解决传统RAG系统复杂性问题提供了有效方案。

2025-11-18 15:03:51 238

原创 【收藏必备】深入理解Transformer:Attention机制如何改变大模型格局

Transformer架构是大型语言模型的核心技术,彻底改变了AI领域。文章详解了其工作原理:输入分词后通过嵌入矩阵转换为向量表示,注意力模块使词语根据上下文相互作用更新语义,MLP模块进一步优化表示。模型通过反向传播训练,调整大量权重矩阵以预测下一个token。这种架构使模型能够捕捉长距离依赖关系,理解复杂语义关系,从而实现强大的文本生成能力。

2025-11-18 14:36:48 627

原创 大模型入门必备:图解Transformer与生成式AI,一篇搞定,建议收藏

本文详细解析了Transformer模型架构,包括编码器和解码器的结构、自注意力机制原理、多头注意力机制、位置编码方法以及残差连接等关键技术。文章通过图解方式深入浅出地展示了Transformer如何通过注意力机制捕捉上下文关系,实现高效并行计算,以及在大模型训练中的应用,为理解现代生成式AI提供了系统化指南。

2025-11-18 11:55:20 850

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除