- 博客(1794)
- 收藏
- 关注
原创 开源大模型微调和部署
什么是开源大模型? 开源大模型与传统开源代码虽然都带有"开源"二字,但本质上存在很大差异。开源大模型是指公开模型权重和架构的人工智能模型,比如LLaMA、Qwen、DeepSeek等。这些模型通常有数十亿甚至上千亿参数,能够处理自然语言、图像等多模态任务。
2026-01-08 10:56:19
403
原创 当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
这两年,大家对大模型已经不再停留在“技术演示多酷炫”,而是越来越现实地问一句:“为什么模型看起来很强,但真要放进我们自己的业务里,用起来总差点意思?尤其是——明明接入了私域知识库,效果还是不稳定?”答案往往不在某一个“神技”,而是在你怎么 同时使用 Prompt、RAG 和微调,以及它们和业务的“耦合深度”。
2026-01-08 10:55:09
541
原创 一句话分析!MCP + GPT-Vis 重新定义 AI 数据可视化
> 在大语言模型(LLM)主导的智能交互时代,纯文本输出早已无法满足数据直观呈现的需求——从数据分析到行程规划,从会议纪要到知识库梳理,人们迫切需要一种“零门槛、高精准、快响应”的可视化工具。AntV 团队重磅推出的 GPT-Vis 可视化组件库 与 MCP-Server-Chart 插件,通过标准化协议与专业渲染引擎的创新组合,让任意 LLM 只需一句话就能生成 25+ 种可视化图表,彻底打破 AI 可视化的技术壁垒。
2026-01-07 18:19:12
561
原创 16种大模型主流微调方法
大语言模型(LLM)的微调是让通用模型适应特定任务的关键技术。本文将系统介绍16种主流微调方法,帮助你根据实际需求选择合适的技术方案。
2026-01-07 18:17:55
242
原创 Refly.AI:大模型驱动的Vibe Workflow,小白也能轻松创建复杂工作流
Refly.AI推出开源的"Vibe Workflow",将传统工作流节点升级为Agent节点,配备2-3个工具,用户通过自然语言即可创建复杂流程。一个Agent节点可替代20个传统节点,通过模型拆分技巧控制成本,牺牲部分准确性换取用户体验提升。专注于内容生成场景,提供迁移功能,旨在降低使用门槛扩大用户规模。
2025-12-31 18:52:52
942
原创 最新最完整的Agent Memory综述
今天的一篇很热乎的深度好文 **"Memory in the Age of AI Agents: A Survey"** (AI智能体时代的记忆:综述),由新加坡国立大学、中国人民大学、复旦大学等多家顶尖机构联合发布,是对当前AI智能体(AI Agents)记忆机制最系统、最前沿的梳理。下面我们一起来看一下~
2025-12-31 18:51:56
665
原创 next-ai-draw-io:AI直接绘制流程图神器,告别手动导入,小白也能轻松上手
本文介绍next-ai-draw-io项目,解决AI生成流程图后需手动下载导入的痛点,提供直接在线绘制draw.io格式图表功能。项目支持多种AI模型,通过源码或Docker部署,使用display_diagram和edit_diagram工具创建编辑图表,并采用三步策略处理XML格式错误,为流程图绘制提供高效AI解决方案。
2025-12-29 18:47:52
952
原创 阿里云大模型Agent开发实战:上下文工程与Multi-Agent优化指南
阿里云团队分享"云小二Aivis"项目实践经验,总结10大Agent优化技巧:清晰化预期、精准上下文投喂、身份与历史执行清晰化、结构化表达逻辑、自定义工具协议、合理使用Few-Shot、保持上下文精简、记忆管理、Multi-Agent架构设计和深入业务场景。这些经验解决了Agent不按预期输出、运行不稳定和产生幻觉等问题,对构建高效稳定的大模型Agent系统具有重要参考价值。
2025-12-29 18:46:55
587
原创 面向生产环境的 LLM Prompt 优化:缓存、结构、自动优化与基准测试
大模型(LLM)能够自动化大量任务。自2022年ChatGPT发布以来,市场上涌现出越来越多利用 LLM 的AI产品。然而,我们在使用 LLM 的方式上仍有许多可改进之处。例如,使用提示词优化工具改进你的提示(prompt),以及利用缓存的token,就是两种简单却能显著提升 LLM 应用性能的技术。在本文中,我将介绍几种具体的技巧,帮助你优化提示的创建与结构,从而降低延迟和成本,同时提升生成结果的质量。本文的目标是为你提供这些切实可行的方法,让你能够立即将其应用到自己的 LLM 项目中。
2025-12-23 14:15:41
682
原创 GPT-5.2 发布后,我意识到一件事!
AI,已经不再是“工具升级”这么简单了-------------------很多人第一反应是: **“GPT-5.2 又强了一点。”**但说实话,如果你只看到“强不强”,那你可能已经错过了这次发布**真正可怕的地方**。我这几天反复体验 GPT-5.2 之后,心里反而有点发凉。 不是因为它多聪明,而是因为——> **它开始像一个“能被托付的同事”了。**
2025-12-23 14:14:35
591
原创 2025大模型Agent开发指南:从入门到进阶,15个项目助你高薪就业
2025年是Agent爆发元年,大模型已从聊天工具升级为能理解任务、拆解步骤的智能体。企业需求集中在对话增强、多模态应用、AI编程及垂直领域。技术人需掌握Model选择、RAG技术、工具调用及编排能力。学习大模型最有效方式是通过项目实践,文章提供15个工业级案例。当前AI人才缺口达500万,本科/专科即可入行,平均起薪2W+,是技术人提升薪资的黄金窗口期。
2025-12-20 09:52:38
671
原创 从ChatGPT到Interleaved Thinking,大模型智能体的演进之路
文章解析了AI大模型从No-Thinking到Interleaved Thinking的四个发展阶段,重点介绍了最新"交错思维链"技术如何实现思考与工具调用的动态反馈循环。MiniMax等模型通过推动生态适配,使这一技术从概念落地为实用能力,让大模型从"回答机器"转变为能独立执行任务的智能体,标志着AI智能体时代的真正到来。
2025-12-20 09:50:36
587
原创 9大高级RAG技术详解:提升大模型检索效果的实战指南
文章介绍9种优化RAG系统的高级技术,包括智能文本分块、重新排序、元数据利用、混合搜索等,解决基本RAG系统的嘈杂结果和不相关上下文问题。文章详细说明如何使用Meilisearch、LangChain等工具实现这些策略,以及如何评估效果,帮助开发者构建更准确、高效的RAG管道,提升大模型性能。
2025-12-19 19:13:05
999
原创 让大模型记住你:必学的持久化记忆+动态画像+多智能体框架实现指南
本文提出一种个性化大模型框架,通过持久化记忆(STM/LTM/摘要/用户画像)和多智能体协作(协调/检索/验证/生成)实现自适应、连续性、定制化对话。系统将当前任务、历史交互与用户偏好融入决策上下文,通过反思校验提升回答质量,在长对话场景表现优异。未来将解决冷启动与主动性,使大模型从"会搜"进化为"懂你"。
2025-12-19 19:12:17
1155
原创 AI Agent实战指南:从理论到落地,程序员必学的智能代理技术
文章深入解析了AI Agent技术,强调其从被动响应到主动执行的革命性转变,详细介绍了自主规划、记忆机制和生态系统交互三大核心技术能力。通过车险理赔案例展示了AI Agent的实际应用价值,并分析了落地挑战与解决方案。文章指出,AI Agent的成功落地70%取决于企业数字化基础设施完备度,20%取决于组织变革,只有10%取决于技术本身。企业应尽早布局数字化基础设施,小步快跑,快速试错。
2025-12-18 17:38:55
1155
原创 大规模RAG系统延迟优化:从局部优化陷阱到系统级解决方案
大规模RAG系统延迟优化需跳出局部思维,采用系统级改造策略。文章提出多层次优化方案:检索阶段采用多级召回与混合检索;上下文管理通过重排序与压缩技术;生成阶段利用高效推理框架与量化技术;系统级层面实施多级缓存与智能路由。只有将各环节有机结合,才能构建真正低延迟、高吞吐的RAG系统,避免"头痛医头脚痛医脚"的优化陷阱。
2025-12-18 17:37:36
1012
原创 提示词工程:6大原则+实战案例,小白也能玩转大模型
提示词工程是解锁大模型能力的核心,通过科学设计Prompt,无需修改模型权重即可适配不同场景。文章系统介绍了大模型理解指令的底层逻辑,提出明确目标、补充上下文、提供示例、设定角色、规范格式、控制语气等六大核心原则,并结合分隔符、思维链等进阶技巧,以及针对不同模型的适配策略,帮助用户提升输出质量、交互效率,降低使用门槛,实现大模型在各场景的高效应用。
2025-12-16 18:31:03
1174
原创 GraphRAG:从向量检索到知识图谱,大模型推理能力的革命性突破
GraphRAG通过引入知识图谱解决传统RAG的技术瓶颈,实现了从"搜索数据"到"推理洞察"的质变。它能处理多跳推理、全局性总结并提供可解释性,但面临构建成本高、图谱质量维护等挑战。未来将采用向量+图谱的混合检索模式,针对不同类型问题选择最优路径,这是企业级AI落地的重要发展方向。
2025-12-16 18:29:35
643
原创 大模型提示词工程:从基础到实战的系统学习
提示词工程是优化大模型输出的核心技术,通过精心设计的指令提升模型表现。关键技巧包括:清晰表达需求、结构化指令、参数调整(Temperature和Top_p),以及进阶方法如零样本/少样本提示、链式思考(CoT)、自我一致性和思维树(ToT)。同时,文章还介绍了提示词攻击的防御措施,帮助开发者安全有效地使用大语言模型。
2025-12-15 11:41:20
984
原创 GraphRAG技术突破:从搜索数据到推理洞察的质变之旅
传统RAG在处理复杂关系和全局性问题时遭遇瓶颈。GraphRAG通过知识图谱将非结构化数据转化为结构化认知,实现从"搜索数据"到"推理洞察"的质变。它在技术上实现了多跳推理、全局总结和可解释性三大跨越,但也面临构建成本高、图谱质量维护和混合检索策略调优等挑战。对于需要深度分析的企业级应用,GraphRAG提供了更具洞察力的解决方案。
2025-12-15 11:40:18
599
原创 从RAG到CAG:让AI拥有记忆,提升大模型应用性能10倍的技术演进
本文详细介绍了从传统RAG到CAG(缓存增强生成)的技术演进,通过为AI添加"内存"缓存静态知识,解决了传统RAG每次查询都需重新检索导致的延迟和成本问题。文中提供了完整的代码实现,展示了CAG如何将响应时间从50-200ms降至<5ms,大幅提升系统性能。文章还探讨了混合架构设计、智能缓存策略、缓存更新机制及生产级最佳实践,为构建高效大模型应用提供了实用指导。
2025-12-12 18:10:29
931
原创 Google Agent系统开发指南:架构、安全、运维全方位解析
Google最新Agent白皮书是一份正式指南,旨在帮助开发者从概念验证过渡到生产级Agent系统。白皮书详细介绍了Agent的四大要素(模型、工具、编排层、部署)、五步工作循环、五级能力分类法,以及多Agent系统架构。特别强调了生产环境中的安全性、质量和可靠性挑战,提出了Agent Ops、评估方法、交互协议、安全防护和学习进化等关键解决方案,为构建企业级Agent系统提供了全面指导。
2025-12-12 18:09:30
1035
原创 LangChain 1.0与LangGraph 1.0全解析:一文掌握AI智能体开发两大框架
LangChain 1.0和LangGraph 1.0正式发布,标志着AI应用开发进入工程化时代。LangChain作为高层抽象框架,适合快速构建简单线性任务和标准RAG系统;LangGraph作为底层运行时引擎,专为复杂、有状态、多智能体协作的生产级系统设计。开发者可根据任务复杂度选择使用,实现从概念验证到生产部署的平滑过渡。
2025-12-11 12:00:36
746
原创 大模型“预训练+微调“范式详解:从理论到实践的完整指南
大模型的"预训练+微调"范式是当前主流训练方法。预训练阶段通过自监督学习在无标注数据上训练模型,使其掌握基础知识和特征表示;微调阶段则利用少量标注数据调整模型参数,使其适应特定任务。文章详细介绍了预训练算法、微调流程,并通过实践案例展示了如何使用HuggingFace库微调BERT模型,使开发者能够快速上手构建专用AI应用。
2025-12-11 11:59:45
1131
原创 AI Agent从入门到实战:谷歌强化课程Day1核心概念与实战指南
这篇笔记介绍了谷歌AI Agent强化课程第一天的学习内容,包括AI Agent的核心概念(定义和关键组件)以及两个重要实验。第一个实验教学习者创建配备Google Search工具的Agent,理解从用户提示到工具调用再到返回结果的流程;第二个实验则涉及各种Agent模式的学习,从单智能体到多智能体系统。课程提供实战源码,适合小白和想转型AI领域的学习者,系统且免费,是入门AI Agent开发的优质资源。
2025-12-10 17:24:34
856
原创 RAG架构重构解决大模型幻觉与知识边界的完整指南
RAG通过将知识外置于动态向量数据库,重构大模型架构解决幻觉与知识边界问题。模型从静态知识容器转变为动态推理代理,知识存储与推理生成分离,实现知识更新无需重训练,检索失败时自动拒答。企业级应用采用混合检索策略和条件化生成机制,可降低幻觉率96%,构建可持续演进的知识生态,实现"知道就知道,不知道就承认"的可信赖AI系统。
2025-12-10 17:23:39
559
原创 模型时代必备技能:将Gemini 3代码部署上线全指南
本文详细介绍了如何将Gemini 3生成的代码部署为可访问应用。通过Cloudflare Pages或云服务器实现网站上线,利用微信开发者工具完成小程序发布。这套流程将"想法→产品"的时间从几个月缩短至几小时,为非技术背景创作者提供了强大赋能,是AI时代必备的实战技能。
2025-12-09 10:28:01
924
原创 如何证明自己有LLM和Agent真实项目经验,拿下AI高薪offer
本文指出,要证明自己具备LLM、Agent和RAG真实项目经验,不能仅停留在调用API层面。需深入理解模型工作流程,能解决RAG幻觉问题,处理多模态数据,量化评估模型准确性,并了解部署上线流程。面试时应围绕"实现功能"、"优化准确性"和"部署监控"三方面展示技术细节和问题解决能力,以此证明真实项目经验,提高求职竞争力。
2025-12-09 10:26:24
760
原创 Google彻底简化RAG:一行API取代复杂工程链,大模型开发迎来零配置时代
Google Gemini File Search将RAG技术从复杂的工程流程简化为一行API调用,自动完成文件分块、向量化、索引和检索。这一变革降低了技术门槛,使开发者无需深入理解底层逻辑即可实现知识检索功能。然而,这也导致工程师角色从系统构建者转变为系统调用者,技术权力逐渐向平台集中。RAG技术并未消失,而是被封装进模型内部,成为更高级功能的基础。
2025-12-06 18:57:41
1109
原创 AI Agent从入门到精通:企业级智能代理系统的技术选型与落地
文章深入解析了AI Agent作为新一代AI系统的核心价值,它具备自主规划、主动执行和动态调度资源的能力,能够解决企业数字化转型的"最后一公里"困境。文章详细介绍了AI Agent的技术原理、架构设计、实战案例,并分析了落地挑战与解决方案。通过车险理赔自动化等案例,展示了AI Agent如何实现从"被动响应"到"主动执行"的转变,帮助企业降低技术门槛和成本。文章强调,AI Agent的成功落地70%取决于企业的数字化基础设施,只有10%取决于技术本身。
2025-12-06 18:56:20
723
原创 大模型智能体工作流深度解析:程序员必学的AI新范式与应用指南
智能体工作流结合AI智能体的推理、工具和记忆能力,实现复杂任务半自主执行。它具有规划、工具使用和反思三大模式,能处理更高复杂度任务,应用于RAG、研究助理和编码助理等领域。技术优势在于灵活性和自我纠正,但也存在复杂性和可靠性风险。这是AI领域新兴热点,为解决复杂问题提供新思路。
2025-12-05 18:51:06
1106
原创 大模型微调技术详解:从理论到代码实践,小白也能掌握
本文详细介绍了大语言模型微调(Fine-tuning)的基本概念、原理和方法。从GPT到ChatGPT的演进出发,解释了微调的作用和优势,包括强化特定任务能力、提高性能、避免数据泄漏和降低成本。重点介绍了LoRA(Low-Rank Adaptation)这一高效微调技术,并通过代码示例展示了如何使用LoRA对BERT模型进行微调,实现电影评论分类。文章强调微调技术门槛不高,即使是10B以下模型,非专业算法人员也可尝试。
2025-12-05 18:50:22
802
原创 模型定制宝典:从提示工程到RLHF,全方位掌握
文章详细介绍了大语言模型(LLM)的六种定制策略,按资源消耗从少到多排列:提示工程、解码与采样策略、检索增强生成(RAG)、Agent框架、微调(含PEFT技术)和基于人类反馈的强化学习(RLHF)。文章还讨论了如何选择合适的基础模型,并对每种技术的工作原理、应用场景和实现方法进行了深入解析,为开发者提供了从简单到复杂的LLM定制路径,帮助不同规模的团队针对特定业务需求优化模型性能。
2025-11-29 19:18:55
657
原创 LangChain+通义千问:手把手教你构建ReAct风格智能体
本文详细介绍如何使用LangChain框架与通义千问模型实现ReAct风格的AI Agent。Agent支持天气查询和名人查询功能,完整展示"思考→行动→观察→最终回答"闭环过程。文章提供完整代码实现,包括天气查询(Open-Meteo接口)和名人查询(维基百科接口)工具,以及LangChain Tools机制和Qwen函数调用能力的应用。代码包含详细注释,适合初学者学习大模型Agent开发,值得收藏参考。
2025-11-29 19:17:57
779
原创 大模型后训练全攻略:从理论到实践,小白也能学会的收藏级教程
本文全面解析大模型后训练技术,涵盖后训练定义、扩展律、流程及方法。详细介绍了微调技术(全量/部分)、对齐方法(RLHF、DPO等)及推理优化(CoT、MCTS等)。通过Llama 3和DeepSeek R1案例,对比SFT与RL优劣,强调后训练对提升大模型性能的关键作用。提供理论分析与实操指南,助力开发者掌握大模型优化技术。
2025-11-28 09:08:07
1168
原创 AI Agent部署指南:批处理、流处理、实时与边缘计算实战解析
本文详细解析了AI Agent的四种核心部署模式:批处理部署适合大规模数据处理,流处理部署处理实时数据流,实时部署支持交互式服务,边缘部署保障隐私安全。通过真实案例、技术工具链和实施细节,为技术决策者提供可落地的部署指南,并介绍未来Serverless Agent、联邦学习等演进趋势,帮助开发者根据业务需求、技术约束和成本效益选择最适合的部署策略。
2025-11-28 09:06:31
1111
原创 大模型「训练」与「微调」概念详解
**本文你将学到什么**1、大模型预训练与微调的基本流程2、预训练、训练、后期预训练、微调的区别3、大模型训练与微调的一些概念,如:Post-pretrain、SFT、RLHF、模型对齐、Lora、Q-Lora、大模型量化、微调指标、微调参数、大模型评测指标
2025-11-26 14:54:40
423
原创 LLM:使用Ollama访问本地大模型
在很多私域部署场景中,用户对数据保密性有要求,不允许数据离开公司,甚至没有互联网,这种情况在线访问的方式就无法使用了,需要调用本地的大模型来满足需求。
2025-11-26 14:52:42
1387
原创 解决RAG图片检索难题:从理论到实践的完整指南
文章介绍了一种解决RAG系统处理多媒体内容(特别是图片)的实战方案。通过将PDF转换为Markdown格式,提取图片并转为在线URL,然后上传到知识库,使系统能够同时检索文本和图片内容。这种预处理增强方法提升了RAG系统的多媒体处理能力,具有结构化、高效检索、灵活性强等优势,为项目创新提供了更多可能性。
2025-11-25 14:21:09
894
原创 打破完美Prompt迷信:通过迭代优化提升大模型应用效果
本文通过电商营销文案生成案例,演示了如何通过四轮迭代优化将平庸提示词提升为生产级指令。文章打破"完美Prompt"迷信,强调提示词开发应像训练模型一样遵循"想法-实现-实验-分析-迭代"的循环过程。作者提供了清晰明确、给模型思考时间、拥抱迭代的实用指南,帮助开发者快速试错、层层迭代,找到适合特定任务的"最佳路径",而非追求万能Prompt。
2025-11-25 14:19:40
713
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅