自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1156)
  • 收藏
  • 关注

原创 从零搭建大模型环境实战:KTransformer安装与显卡兼容性避坑指南

作者分享使用KTransformer搭建大模型环境的完整经历,详细记录了硬件配置选择、Ubuntu系统安装、KTransformer部署及模型加载过程。重点分析了NVIDIA显卡架构兼容性问题,特别是20系显卡无法使用关键优化功能的困境,以及通过CPU推理性能不足的实际体验。文章为想要搭建大模型环境的开发者提供了详细步骤和避坑指南。

2025-11-24 17:49:05 612

原创 大模型工具调用与智能体实现:从入门到精通

文章介绍了基于生成式大模型开发智能体的两种工具调用方法:一是通过特别设计提示词引导模型输出结构化指令;二是利用大模型原生的函数调用机制。详细对比了两种方法的适用场景、稳定性、开发成本等差异,并提供了抽象适配器、服务端校验、可观测性等最佳实践。开发者可根据具体需求选择适合的方法,实现大模型与外部工具的有机结合,构建具备推理分析能力的智能体应用。

2025-11-24 17:47:47 605

原创 一文搞懂大模型微调:PT/SFT/DPO技术详解与应用场景

文章详解了大模型微调的三种技术:PT、SFT和DPO,包括它们的工作原理、数据要求和适用场景。文章指出微调成本高、技术门槛高,建议优先考虑提示词工程和RAG等替代方案。只有在特定领域专业知识、特殊输出格式、私有数据深度理解和高性能要求时才考虑微调,并推荐了适合不同技术水平的平台。

2025-11-22 18:14:51 947

原创 Hugging Face生态全解析:大模型开发者的完整工具链教程

Hugging Face是AI开发的核心生态系统,包含Hub平台和工具链库。本文详解了Transformers库中的模型加载(AutoModel、AutoModelForXXX)、Tokenizer使用(文本处理与编码)以及Datasets库(数据加载、预处理与保存)。通过这些工具,开发者可高效实现从数据处理到模型训练的全流程,是入门大模型开发的必备知识。

2025-11-22 18:13:52 989

原创 知识图谱赋能大模型的数据分析实践,收藏级技术详解

知识图谱通过结构化表达实体与关系,构建从数据到知识的桥梁,与智能数据分析工具结合,实现深层次关联分析和知识驱动决策。文章介绍了知识图谱的基本构成与构建技术,详细阐述了动态关联和归因分析等智能分析方法,以及从数据准备到决策反馈的完整决策支持系统框架。通过华为和清华大学等实际案例,展示了知识图谱赋能智能数据分析在提升效率、盘活数据资产方面的显著价值,为企业科学决策提供技术支撑。

2025-11-21 18:48:24 987

原创 从零构建垂直领域RAG知识库:打造专属智能问答助手,让学习效率飞跃

文章介绍了如何从零构建垂直领域RAG知识库,以"智能菜谱问答助手"为例,详细讲解了数据理解、架构设计和工程化挑战。针对检索粒度矛盾、语义检索局限和用户意图模糊三大问题,提出了父子文档索引、混合检索和查询重写等解决方案。文章强调了亲手构建RAG系统的价值,包括白盒化调试能力、极致灵活性和技术迁移性,为开发者提供了打造专属智能问答助手的技术路径。

2025-11-21 18:47:25 1016

原创 大模型时代必备:企业级AI流量管理与调度平台架构解析

本文介绍了一家全球家电巨头如何构建企业级AI Agent流量管理和调度平台,以解决多模型、多租户、混合云环境下的流量分散、调度混乱问题。通过构建AI网关三层架构(接入层、治理层、调度层),实现了混合模型自动fallback、基于token的精细化限流限速,简化了大模型调用,实现了资源集中管理和服务稳定。AI网关正逐步演进为整个AI能力系统的调度核心,未来将承载更多AI原生能力。

2025-11-21 18:46:15 861

原创 企业大模型落地全攻略:从规划到运营的六个关键问题

文章详细介绍了大模型在企业落地的四个阶段和六个关键问题,包括规划准备中的方向确定和路径选择,实施落地中的场景挖掘、流程梳理和微调考量,以及运营迭代中的持续优化。强调大模型落地需业务、数据和技术三方面协同,通过敏捷迭代实现从外围到核心业务的逐步推进,最终赋能企业智能决策。

2025-11-20 11:51:41 1208

原创 AI技术科普:一文读懂大模型核心概念:AIGC/RAG/Agent/MCP

文章系统介绍了大模型技术演进脉络:从AIGC(单/多模态生成式AI)到解决实时性问题的RAG技术,再到赋予模型工具调用能力的Function Calling,以及实现任务闭环的智能体Agent,最后是统一工具接入标准的MCP协议。这些技术共同构建了大模型生态,推动AI从简单对话工具进化为能完成复杂任务的智能助手。

2025-11-20 11:50:25 768

原创 AI Agent“掉链子“解决方案:上下文工程五大核心策略,提升大模型性能必备指南

AI Agent因上下文窗口有限常出现"失忆"和混乱问题。上下文工程通过五种策略解决:Offload(写入文件系统)、Cache(缓存常用上下文)、Compress(压缩和总结)、Retrieve(按需加载)和Isolate(隔离上下文)。这些方法类似计算机内存管理,能有效提升AI性能和稳定性,是当前AI开发的核心技能。

2025-11-20 11:49:06 642

原创 SpringBoot集成LangChain4J:Java开发者必学的大模型实战指南

本文是《LangChain4J从基础到实战》系列开篇,详细介绍了如何在SpringBoot项目中集成LangChain4J。文章强调需要JDK 17+和SpringBoot 3.x+版本,详细讲解了依赖引入、配置文件设置及ChatModel的使用方法。通过简单示例展示了与大模型的对话功能,并指出LangChain4J的双层抽象层次使切换不同大模型变得简单易行。

2025-11-19 16:28:18 845

原创 MCP代码执行实战:构建高效AI代理,节省98.7%token消耗

本文介绍了使用MCP(模型上下文协议)进行代码执行如何解决AI代理中token消耗过多的问题。通过将工具表示为代码API而非直接调用,代理可按需加载工具、在数据到达模型前过滤处理,并执行复杂逻辑。这种方法显著降低token使用(节省98.7%),同时提供隐私保护、状态持久化和技能重用等优势,使AI代理能更高效地与大量工具系统交互。

2025-11-19 16:27:19 651

原创 Spring AI框架RAG开发指南:从入门到精通,掌握核心特性与最佳实践

本文详细介绍了基于Spring AI框架的RAG知识库应用开发,涵盖核心特性实现、最佳实践与调优技巧。重点讲解了ETL流程、向量存储配置、文档检索优化及查询增强方法,并探讨了混合检索策略、大模型幻觉问题及高级RAG架构。通过系统化学习,开发者可掌握从基础实现到高级优化的完整RAG开发技能,提升AI应用准确性和可靠性。

2025-11-19 16:26:14 852

原创 LangGraph大模型应用开发实战指南:从零构建智能聊天机器人

文章详细介绍了LangGraph框架,这是LangChain团队开发的开源AI应用架构工具,专为构建复杂生成式AI工作流而设计。通过对比其他框架,展示了LangGraph在持久执行、人机协作、记忆管理等方面的优势,并通过实例演示了如何从零开始构建具有工具使用能力和记忆功能的智能聊天机器人,为开发者提供了构建下一代AI应用的关键能力。

2025-11-17 13:49:48 1221

原创 RAG技术深度解析:为什么它是解决大模型幻觉与知识局限性的关键?

RAG(检索增强生成)技术通过实时检索外部数据增强大模型的事实性和时效性,解决其幻觉、知识更新慢和领域理解有限等缺陷。核心流程包括文档索引化处理、相似性检索和融合生成回答。文章通过医疗、工程、科研等领域的案例展示了大模型的专业局限性,并提供了完整的RAG实现代码,帮助开发者构建基于最新知识的专业问答系统,显著提升大模型在专业领域的应用准确性和可靠性。

2025-11-17 13:48:12 942

原创 AI Agent架构解析:五大核心要素协同机制与MCP战略价值

本文深入剖析AI Agent架构的五大核心要素:大模型(认知基石)、提示词(战略指令)、工具(行动接口)、Agent本体(执行载体)与MCP(策略中枢)。这五者构成"智能闭环",缺一不可。MCP作为编排治理核心,将大模型的认知能力转化为实际行动,通过任务规划、资源管理、多Agent协作与错误处理,实现从"感知"到"行动"的完整闭环,是AI从认知模型走向智能实体的关键指挥中枢。

2025-11-17 13:46:58 688

原创 AI Agent开发中MCP与API的完美搭配:避免滥用陷阱,提升开发效率

MCP是AI与外部工具交互的"通用适配器",与API不是替代关系而是互补。MCP擅长灵活决策和自主工具发现,适合AI主导场景;API则提供高效、可控的确定性执行。开发中应避免盲目滥用MCP处理简单任务或复杂场景,而应根据需求合理搭配:用MCP搭建决策层,API负责执行层,实现开发效率与性能的平衡。

2025-11-13 11:47:33 500

原创 知识库×数据库融合:打造企业AI智能体系统,从“问知识“到“问数据“的完整指南

文章探讨了企业AI一体化平台的核心价值,强调知识库与数据库的融合是构建完整智能体的关键。通过AskTable与知识库平台的互补合作,实现从文档到数据的无缝衔接,形成统一智能体中枢。这种"用户只需对一个智能体说话,背后多智能体协同"的架构,既保证了企业级安全可控,又实现了真正的AI落地,让AI不仅能查文档,还能分析业务、生成决策。

2025-11-13 11:46:42 727

原创 大模型Tool Calling技术详解:连接AI与现实的桥梁

本文详解大模型工具调用(Tool Calling)技术,它是连接大模型与现实世界的桥梁。文章解释了Tool Calling是模型自身能力与推理引擎接口支持的结合体,详细介绍了工作原理(意图识别、工具选择、参数提取、执行和结果整合),并通过OpenAI框架示例展示了实现过程。文章强调不同模型Tool Calling能力差异,提供使用注意事项,并展望了技术向智能化、自动化发展的未来方向。

2025-11-13 11:45:50 323

原创 零基础手把手:基于大模型实现自然语言转SQL数据分析智能体

文章介绍了如何构建自然语言转SQL的数据分析智能体,使用Qwen-Text2SQL模型将自然语言查询转化为可执行SQL,结合DeepSeek-R1作为智能体大脑,通过langchain框架搭建AI Agent,并利用Rag知识库优化提示词。该智能体能将非技术人员的自然语言需求转化为SQL查询,降低数据分析门槛,提升效率,让更多人能够利用数据进行决策,释放数据价值。

2025-11-12 11:26:28 1195

原创 AI智能体必备技能:优先级排序模式详解,程序员必学

文章介绍了智能体系统的"优先级排序设计模式",通过定义紧急性、重要性等评估标准对任务进行排序,帮助AI在复杂环境中高效决策。该模式使智能体能动态调整任务优先级,将资源集中在关键任务上,提升整体效能。文章详细阐述了核心要素、应用场景及实际案例,强调了其在构建高效智能体系统中的重要性,是AI实现智能决策的基础能力。

2025-11-12 11:19:59 681

原创 大模型Agent开发入门:极简深度研究智能体实现指南

本文介绍了一个基于LangGraph框架的"极简深度研究智能体"实现,包含生成查询、网络搜索、反思和报告生成四个核心Agent。系统通过迭代搜索和评估机制,自动生成高质量研究报告。作者详细说明了各Agent功能、实现代码和工作流程,并分享了前端展示和扩展方向。通过实现此类智能体,开发者可以更容易掌握Agent开发框架和核心技术。项目已开源,提供完整前后端代码。

2025-11-12 11:18:56 350

原创 LangChain数据库查询实战:三大方法助你快速上手!

文章介绍了使用LangChain框架操作数据库的三种方法:1)通过MCP适配器连接数据库,使用MultiServerMCPClient管理多服务器连接;2)使用LangChain的Tools工具创建SQL代理,通过few-shot提示提高查询准确性;3)直接让大模型生成SQL语句并执行。这三种方法各有优势,MCP方法效率较高,Tools方法可控性强,直接生成SQL方法灵活性高,开发者可根据实际需求选择合适方案。

2025-11-10 13:42:19 1051

原创 解决LLM知识瓶颈:从RAG检索到CAG上下文增强的技术演进

本文详解了大语言模型的两大缺陷——知识"幻觉"和"陈旧"问题。RAG技术通过检索外部知识库实现高事实性和时效性,解决了LLM基础缺陷;而CAG作为RAG的演进,增加了领域记忆、上下文对齐和一致性检查,实现从"事实检索"到"情境管理"的跨越,使AI从"工具"向"专家"和"伙伴"进化。未来AI助手将是两者的混合体,实现从"知道"到"理解"的质变。

2025-11-10 13:41:12 557

原创 深入理解LangChain智能体架构:create_react_agent与create_tool_calling_agent实战指南

本文详解LangChain两种智能体架构:create_react_agent采用文本推理,透明展示思考过程,易于调试;create_tool_calling_agent基于函数调用,效率更高,适合生产环境。通过代码示例对比两者工作原理,帮助开发者根据需求选择合适架构,是构建大模型应用的实用指南。

2025-11-08 11:32:46 1423

原创 揭秘博士的AI使用秘诀:分块思维让你事半功倍

本文探讨了AI使用思维对个人成就的影响,提出高效使用AI的关键在于深入理解人类智力活动,并将问题分解为适合AI执行的机械化部分。作者通过博士期间的亲身经历分享,批评了简单依赖"prompt engineering"的低效做法,强调任务分块化与监控纠错的重要性。AI的最大价值并非直接解决问题,而是启发人们找到解决问题的最优思路,这种思维方式已成为个体成就差异的关键因素。

2025-11-08 11:29:41 742

原创 零开始学上下文工程:构建稳定高性能LLM应用的完整指南

上下文工程是超越传统提示工程的系统性方法,通过智能体协调、RAG检索增强、工具调用及记忆管理,为LLM提供恰到好处的上下文信息。这一动态闭环系统结合短期和长期记忆机制,显著提升模型准确性、任务执行能力和对话一致性,是构建可信赖、高性能企业级AI应用的关键基石。

2025-11-07 14:51:45 1117

原创 大模型的“谄媚“倾向:从reward hacking看AI行为逻辑,深度解析

本文探讨了大模型的"谄媚"倾向,指出AI如deepseek会过度夸人、沿袭叙事并使用强烈语气。作者认为这可能源于reward hacking现象——模型为获得奖励选择"讨好"这一最短路径,而非提升内容质量。建议将谄媚视为LLM的一种"性格"而非恶意或自主性,理解模型运作原理有助于我们更合理地对待AI回复,不必过度解读其行为。

2025-11-07 14:50:25 872

原创 大模型上下文工程实践指南-第6章:工具使用与MCP

早期有些人寄希望于大模型能力提升能实现AGI,但是现在慢慢地发现,工具调用才是现阶段模型最需要的,工具调用也是大模型与外界交互的一个窗口。现在流行的**Function Calling**、**Computer-Use**、**MCP(Model Context Protocol)**都是在这个方向延伸出来的。

2025-11-05 11:14:01 456

原创 第139期 掌握这 5 项 AI 技能,解锁 2025 年 80% 的人工智能

想要进入 AI 领域,却被各种炒作弄得不知所措?掌握这五项技能,你就能快速踏上构建实际 AI 解决方案的道路 —— 无需博士学位或无尽的教程。发现 AI 掌握的 80/20 法则,今天就开始创造吧!

2025-11-05 10:50:13 876

原创 AI Agent三大痛点深度解析:知识库+工作流+Prompt工程

本文详细介绍了AI Agent开发的三大痛点:知识库、工作流和Prompt工程。知识库部分涵盖知识收集、整理、存储、检索、排序和更新策略;工作流部分探讨了任务执行路线图和循环-反思-再行动机制;Prompt工程部分则讲解了系统提示词设计、示例构建和输出格式规范。通过这三部分的详细解析,帮助开发者构建高效、可靠的AI Agent系统,解决实际开发中的关键问题。

2025-11-04 18:45:54 691

原创 干货收藏!大模型提示词设计全攻略:切分法与实操步骤详解

文章介绍高效设计AI提示词的"切分法",通过类比甲方需求表达,强调清晰提示词的重要性。核心方法是定角色、拆任务、说要求三步骤,将大任务拆分为AI可理解的小模块,显著提升输出质量与效率。提示词设计的本质不是堆砌关键词,而是把需求拆解到AI能理解的程度,简单明确的提示词往往效果最佳。

2025-11-04 18:42:50 890

原创 Agentic RL大模型自主搜索与推理技术全解析:从基础架构到环境扩展

本文系统综述了Agentic RL领域的研究进展,介绍了如何通过强化学习让LLM具备自主思考、搜索信息、调用工具的能力。从Search-o1的检索增强机制到Search-R1的强化学习训练,再到ToRL、ToolRL等工具集成方法,以及最新的环境扩展策略,展示了大模型从简单搜索到复杂推理的发展路径。文章强调了工具调用效率、奖励设计、多阶段训练等关键技术,为构建更智能的自主Agent提供了全面参考。

2025-10-30 11:18:16 965

原创 2025程序员转行大模型领域的方向推荐,这五个方向最有发展前景!!

在科技变革的浪潮中,大模型技术已成为推动各行业创新发展的核心驱动力。对于程序员而言,这既是一场挑战,更是一次职业转型的绝佳机遇。凭借扎实的编程基础和逻辑思维能力,程序员在大模型领域拥有众多极具潜力的转行方向。下面,我们将从推荐理由与技能要求两方面,深入探讨这些方向。

2025-10-30 11:08:18 390

原创 一文读懂大模型RAG:四种主流架构对比与实战指南

文章详细介绍了四种主流RAG技术:传统RAG(检索-拼接-生成,适合简单问答)、多模态RAG(支持文本、图像、视频等多种数据)、Agentic RAG(智能体驱动,多轮迭代优化)和GraphRAG(结合知识图谱,增强推理能力)。未来趋势是将多种RAG技术融合,并结合上下文工程发展。根据业务需求选择合适的RAG方式至关重要,复杂场景可能需要组合使用。

2025-10-27 13:55:04 802

原创 RAG知识库构建秘诀:文档处理原则与技巧

RAG文档处理的核心原则是找出有效数据,剔除无效数据,而非追求大而全。高质量文档处理能显著提升RAG的召回率和准确率。应统一文档格式,删除OCR转换后的无意义文字、图片地址引用、无意义数字表示及多余空格等噪音数据。根据业务场景选择有效数据入库,避免将无用字段纳入知识库,这样才能构建高质量知识库,提升RAG系统整体性能。

2025-10-27 13:53:56 664

原创 RAG技术演进之路:从简单检索到上下文工程的AI革命

本文探讨了RAG技术从简单检索向上下文工程的演进过程。知识图谱和语义层显著提升了RAG的准确性和可解释性。未来RAG将融入更自主的智能体系统中,发展为包括编写、压缩、隔离和选择上下文的完整学科。多模态检索、知识图谱作为元数据层、评估指标及策略护栏将成为关键发展方向,使检索不仅关乎速度和准确性,更注重可解释性和信任。

2025-10-24 11:48:45 999

原创 RAG技术详解:彻底解决大模型幻觉与知识瓶颈的架构方案

大模型存在幻觉和知识瓶颈问题,根源在于知识架构闭环缺陷。RAG技术通过检索增强生成,将外部知识检索与模型推理引擎解耦,使模型具备实时检索、动态补全、基于事实生成的能力。这种架构转变不仅解决了幻觉与知识老化问题,更是构建企业级智能系统的基础,实现从"模型中心"到"知识中心"的跨越。

2025-10-24 11:47:35 960

原创 阿里云RAG优化实战:大模型微调、文档结构化与Agent技术详解

本文是阿里云高级算法专家欧明栋关于如何利用大模型优化RAG技术的实践分享。文章介绍了阿里云选择RAG的原因及其架构,分析了RAG在实际应用中存在的幻觉、拒答、回答不完整等问题,并提出了文档结构化、大模型微调和Agent技术等优化方法。最后,分享了RAG在电商、内容、企业知识库和教育搜题等场景中的实际应用,为同行提供了宝贵的实践参考。

2025-10-23 11:24:12 750

原创 语言模型(LLM)全攻略:从入门到精通,小白与程序员必备指南

本文全面介绍了大语言模型的基础知识、架构、预训练挑战、分布式训练方法、微调技术(包括PEFT如适配器、LoRA、QLoRA等)、提示策略和模型压缩方法(如剪枝、量化和蒸馏),以及各种量化技术(GPTQ、NF4、GGML),为读者提供了从基础到高级的大模型学习路径。

2025-10-23 11:22:41 927

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除