自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(917)
  • 收藏
  • 关注

原创 从入门到精通(附实操),Doc-Researcher暴涨240%背后:多模态文档研究的核心逻辑!

在ChatGPT引领的AI革命中,大语言模型(LLM)展现了惊人的推理能力。然而,当面对专业领域的复杂文档时,它们却常常“束手无策”:

2025-11-04 09:22:27 1706

原创 从DeepSeek 的爆火看 AI,应用的新范式和大模型从业者的未来

鲁为民博士清华学士,加州理工学院博士中国人工智能最高奖“吴文俊人工智能科学技术奖”2023年获得者刘井平博士华东理工大学副教授复旦大学博士多项研究成果在美团、淘宝、蚂蚁金服、华为等公司进行落地胡箐金智维首席科学家前Meta 旗下LLaMA大模型初创团队核心成员之一前微软技术部门负责人,Exchange online、Azure AI 等产品线研发负责人20年的AI技术研发与应用经验时间:2月22日星期六面向受众:大模型及AI技术人员和爱好者和企业技术主管等。

2025-02-21 16:00:14 610

原创 2025中国AI Agent最佳实践案例TOP20,Agent企业落地看这一篇就够了!

在数字化浪潮席卷全球的今天,大模型正以核心驱动力的姿态,深刻推动着社会进步与商业创新的双重变革。尤其在AI Agent领域,技术已实现从概念构想到落地实践的跨越式发展——它们不仅颠覆了传统工作模式,更重新定义了人类对智能技术的想象边界。

2025-11-24 18:03:53 457

原创 选Agent Framework还是Semantic Kernel?别再纠结了!这篇深度拆解,让你做出最优选择!

如果你已经在用 Semantic Kernel(后文简称 SK)写“会调用几个插件”的聊天助手,突然发现微软又冒出一个 **Agent Framework**,并且还一堆 `Microsoft.Agents.AI.*` 的项目目录正向你招手——此刻的你,也许就像十年前刚理解依赖注入,又被告知“我们要转向函数式”那种微妙心情。别慌,这篇超长、结构化、技术 + 思辨 + 轻幽默的文章,帮你在架构、理念、实现与落地策略上一次分清:它俩不是“谁替代谁”,而是“领域抽象层次与工程化路径的分岔与互补”。

2025-11-24 17:35:13 555

原创 这个框架,我愿称之为RAG的“Android系统”!清华开源MCP,打造AI应用生态的基石!

UltraRAG 的开源项目是首个基于 MCP 的检索增强生成(RAG)框架,不写代码也能玩转。 用 YAML 文件轻松构建复杂 RAG 系统。 RAG 系统:简单来说,就是让 AI 模型能先检索相关信息,再生成答案,从而提高准确性。

2025-11-24 17:33:40 454

原创 告别逐字阅读!AI合同审查系统,给你一双孙悟空的“火眼金睛”,风险条款一眼看穿!(附系统截图)

告别逐字阅读!AI合同审查系统,给你一双孙悟空的“火眼金睛”,风险条款一眼看穿!(附系统截图)

2025-11-24 15:53:04 299

原创 (建议永久收藏)AI Agent开发终极宝典!万字长文,保姆级教程,小白也能从零构建智能体!

最近终于开始Agent开发实战了。我们要基于一个地图产品,做AI交互。初期先做一些基于地图信息的查询问答功能,后期再扩招到复杂的分析功能, 最后做AI绘制功能。

2025-11-24 15:51:14 446

原创 AI Agent原理太复杂,学不进去?别怕!这张“五脏六腑”图,让你5分钟看懂从感知到进化的全过程!

如果说大语言模型(LLM)是拥有广博知识的“大脑”,那么 **AI Agent(智能体)** 就是为其装上了手脚和感官的完全体。它不再仅仅是回答问题的聊天机器人,而是一个能够自主感知、规划、执行并从错误中学习的智能系统。

2025-11-24 15:44:04 286

原创 DeepMind王炸!多模态模型Flamingo为何被誉为里程碑?一文看懂其视觉-语言交互的精髓!

近年来,多模态模型的研究取得了巨大进展。CLIP、BLIP 等视觉语言对比学习方法展现出强大的 zero-shot 分类能力,而 GPT-3 类的大语言模型则通过大规模预训练展现出令人惊叹的 few-shot 推理能力。然而,将“视觉理解能力”与“语言生成能力”统一到一个通用模型中,依然是多模态模型的重大挑战。

2025-11-24 15:42:19 467

原创 Agent总是“聊完就忘”,无法举一反三?别再怪模型了!从DC到ACE,让AI拥有“成长型思维”!

你是否曾有过这样的经历:每次与聊天机器人对话,都感觉像是第一次见面?你必须不厌其烦地重复背景信息,因为它完全不记得上一秒的交流。这正是当前绝大多数大语言模型(LLM)普遍存在的“失忆”问题——它们在处理每个新请求时都像一张白纸,无法从过去的成功或失败中吸取教训。

2025-11-24 15:38:49 389

原创 保姆级教程!手把手教你用Playwright MCP给LLM装上“身体”,打造第一个能干活的AI智能体!

Playwright MCP是一个基于Model Context Protocol的桥接工具,它将强大的浏览器自动化框架Playwright与LLM连接起来。MCP协议允许LLM访问外部工具和资源,而Playwright则提供了跨浏览器的自动化能力。

2025-11-23 11:00:00 393

原创 不止是部署!关于Dify企业落地的深度思考:稳定性、成本与安全的平衡之道。

Dify应用平台在内部使用的主要问题在于:**当前无法确定一个稳定版本用于生产环境**。目前Dify发布的新版本中总会引入新的不可预知的问题,以最近发布的1.9.0~1.9.2版本为例进行说明(仅描述个人发现的问题):

2025-11-23 09:45:00 772

原创 毫无基础的人如何入门 AI大模型?

2025年11月,杭州某电商公司的招聘现场爆出猛料:一位毫无技术背景的35岁宝妈,凭借用AI工具搭建的智能客服系统,击败20名计算机专业应届生,成功拿下月薪28K的AI运营岗位。这个真实案例正在颠覆行业认知——**AI大模型早已不是程序员的专属,而是像Excel一样的全民工具**。

2025-11-22 15:01:45 745

原创 给伸手党的福利:AI大模型 新手入门引导

当我们谈论AI大模型时,本质上是在谈论效率革命。学会用模型处理重复性工作,把时间留给创意和决策,这才是普通人的破局之道。记住:2025年最危险的不是不会写代码的人,而是不会用AI提升自己的人。

2025-11-22 10:29:24 1117

原创 性能实测!Redis 8.0向量库 vs Milvus/Pinecone,谁才是大模型RAG的性价比之王?

在大模型知识库开发领域,向量数据库的选择直接影响系统的性能、扩展性和开发效率。随着Redis 8.0推出Vector Set数据结构并增强向量搜索能力,开发者面临新的选择困境:是采用传统专用向量数据库(如Milvus、Pinecone),还是拥抱Redis这一“新晋”向量存储解决方案?本文将从技术架构、性能指标、成本效益和典型场景四个维度,为您提供一套完整的决策框架,帮助您在大模型知识库开发中做出最优选择。

2025-11-22 10:28:52 775

原创 转行AI大模型,先吃透这个!Dify核心:提示词工程VS上下文工程,让你少走99%的弯路!

在AIGC 应用开发的时候我们通常会遇到两个名词提示词工程和上下文工程,而且在dify的配置上我们也会看到这两个按钮,但是他们是什么关系的,各自对于AIGC应用影响的程度是怎样的?今天我们来详细分析一下。

2025-11-22 10:27:23 742

原创 你的RAG还在“胡说八道”?元凶是“冗余知识”!Zero-RAG,让AI只读精华!

首先提出了"掌握度评分"这一指标,用以精准识别RAG知识库中的冗余知识并进行剪除。经过剪枝后,对于模型已"掌握"的问题,其回答将主要依赖模型自身的内部知识。

2025-11-22 10:21:02 509

原创 你的AI Agent性能如何优化?” 面试官这个问题,答不上“Agent Lightning”的直接下一轮!

传统智能体优化需要重构代码、重写逻辑。时间成本高。技术门槛更高。

2025-11-22 10:17:39 535

原创 还在为写SQL烦恼?LangChain 1.0教你构建NL2SQL Agent,解放双手!

在企业级数据分析场景中,“自然语言问数据” 已经成为新一代智能 BI 的主流趋势。 本文教你如何使用 LangChain 1.0 的 ReAct Agent 架构,实现 NL2SQL 数据分析,使业务人员能够以对话式交互高效获得数据洞察。本文将带你完整了解:

2025-11-22 10:15:02 541

原创 还用LangChain老版本?你已经被同龄人甩开了一条街!v1.0才是生产级Agent的入场券!

LangChain 发布了其 1.0 版本。这不仅仅是一个版本号的跳跃,它标志着 LangChain 从一个快速迭代的实验性框架,正式迈向了一个**专注、稳定、生产就绪**的 Agent 构建平台。v1.0 围绕三大核心改进进行了精简和重构:全新的 `create_agent`、强大的中间件(Middleware)系统、以及标准化的内容块(Content Blocks)。

2025-11-22 10:13:20 924

原创 让你的笔记“活”过来!从个人AI到企业大脑,高精度RAG知识库构建全攻略!

在企业中,垂直RAG知识库包含了特定领域的专属术语、事实信息和内部规范,使得问答系统能够处理高度专业化的问题,同时能避免敏感数据泄露。

2025-11-21 17:53:38 911

原创 2025大厂面试新宠:动态RAG缓存体系,3个核心点+1张架构图,Offer稳拿!

在前几篇动态 RAG 的文章里,我讲过一个非常关键的事实:动态 RAG 最大的成本,不是模型,是 I/O 和检索链路。

2025-11-21 17:42:38 588

原创 警告!选错框架,一年白干!Spring AI、LangChain、LangGraph、LlamaIndex,你站哪队?

在当今人工智能飞速发展的时代,大型语言模型(LLM)已成为技术创新的核心驱动力。选择合适的开发框架对于构建高效、可扩展的大模型应用至关重要。本文将对四种主流大模型开发框架——Spring AI、LangChain、LangGraph和LlamaIndex进行全面对比分析,从核心架构、功能特性、适用场景到性能表现等多个维度展开深入探讨,帮助开发者根据项目需求做出明智的技术选型决策。

2025-11-21 11:26:39 777

原创 Anthropic官方“圣经”泄露!这份PDF,把从Prompt到Agent的价值百万心法全讲透了!

AI 现在的热度,已经从“什么是 GenAI”变成了“怎么用它赚钱”。 很多人还在把 AI 当聊天玩具,但聪明的企业已经在用它重塑护城河了。 最近,Claude 的母公司 Anthropic 发布了一份重磅的企业级指南,用上千个真实案例总结出了一套“AI 落地四步法”。 今天,我把这份长达 30 多页的英文干货,浓缩成这篇精华,帮你省下几万美元的咨询费。(建议收藏,文末有保姆级提示词框架)

2025-11-21 11:25:05 550

原创 别再让AI“聊完就忘”了!Anthropic这篇,教你如何赋予AI“长期记忆”!

上下文工程可以看作是提示词工程的延伸。提示词工程说的是如何编写和安排对大模型的指令,让模型更容易给出理想的结果。

2025-11-21 11:24:03 252

原创 别再被名词绕晕了!一文读懂AI大模型的原理与现状!

AI的核心目标是**让机器能够执行通常需要人类智能的任务**,例如语言理解、图像识别、复杂问题解决等。

2025-11-21 11:22:47 986

原创 终极选型指南)AI“四大天王”怎么选?这篇把优缺点和适用场景扒得明明白白!

为啥会写这篇文章?是因为我前几天看到一个报告,报告显示,大部分人还只是停留在简单与模型对话,甚至只有2%的人开发过智能体,更离谱的是30%多仅仅是听说过。表明整体AI技能基础相对薄弱。

2025-11-21 11:22:09 288

原创 大厂内部文档流出!上下文工程的“降本增效”秘籍,落地必看!

每个使用大语言模型(LLM)构建应用的开发者都会遇到同样的瓶颈。你从一个强大的模型开始,它能够写作、总结、推理,表现出惊人的能力。但当你尝试将其应用到现实世界的问题时,裂缝就开始出现:

2025-11-21 11:21:18 640

原创 【AI涨薪秘籍】当别人还在调Prompt,你已精通Context Engineering!这段认知,让你薪资翻倍

Google最新发布的技术白皮书《Context Engineering: Sessions, Memory》揭示了一种突破性的解决方案——上下文工程,它正在重新定义如何构建具有长期记忆的智能代理。

2025-11-21 11:19:37 757

原创 你的RAG为什么总在“胡说八道”?元凶就是文档解析!

知识库是RAG的灵魂,一个好的知识库能解决绝大部分RAG问题。在之前关于RAG的优化文章中,大部分都是在强调检索端的优化,而关于文档解析方面的内容却非常的少,而这也是有原因的。在之前介绍RAG的文章中,曾说过RAG是一种方法论,而不是一项具体的技术;其中文档召回模块又分为两大块,一块是知识库的构建,另一块是检索召回;而之前的文章主要就是针对检索召回和上下文管理。而今天所讨论的文档解析,就属于知识库的构建,而这也是RAG系统好与坏的基石;一个好的知识库是RAG系统的基础,否则所谓的增强生成只能是空中楼阁。

2025-11-21 11:18:09 611

原创 逼自己练完这48页你的Agent就很牛了!!

AI Agent在于其能自动执行复杂任务,大幅提升自动化和智能决策的效率,让任务自动化,主要包括感知、记忆、规划与决策、行动/使用工具。

2025-11-20 16:44:27 197

原创 性能炸裂!Agent RFT深度解析:不止是微调,更是用强化学习重塑智能体“大脑”!

智能体 (Agent) 与常规模型的根本区别在于它能够与外部世界互动以完成任务,它不需要总是通过人类转达,而是可以自主地完成工作。为了实现这一点,智能体必须能够访问工具。例如,一个编码智能体需要访问终端、代码解释器或整个代码库;一个客户服务智能体可能需要访问内部软件来查询客户记录,访问计费系统来处理退款,甚至需要能够将问题升级给人类。智能体需要一种方式,通过使用工具来与其业务背景和外部世界进行交互。

2025-11-20 11:07:57 700

原创 等待?不存在的!Lightroom Classic 15.0 王者归来,用“火箭速度”重新定义摄影后期。

摄影后期软件 Adobe Lightroom Classic(以下简称 “LrC”)迎来重大更新——版本 15.0 正式发布(目前已经是15.0.1)。此次更新涵盖性能优化、编辑工具增强、工作流改进等多个维度。

2025-11-20 11:06:10 1376

原创 AI编程的“新大陆”被发现!深度剖析Copilot开源的Agent原理,这是你的掘金蓝图。

editCodeIntent可以说是整个代码库中最核心的文件之一。它不仅实现了所有“编辑代码”相关的功能,更重要的是,它为更高级的 AgentIntent(即 Agent 模式)提供了底层的实现基础和框架。理解了它,就等于理解了 Copilot 是如何将语言模型的输出转化为对代码的实际修改的。

2025-11-20 11:05:13 739

原创 保姆级教程!LangChain RAG(十):手把手实现父文档检索器,源码+实战一篇通!

在 RAG 应用开发中,文档拆分 和 文档检索 通常存在相互冲突的愿望,例如:

2025-11-20 11:04:11 617

原创 警告!LLM已现“不可逾越”的技术鸿沟,别再为“伪智能”的泡沫买单

最近即将离职的Meta首席AI科学家、图灵奖得主杨立昆表示,全球大型科技公司投入巨额资金在 ChatGPT、Google Gemini、Meta Llama这类大型语言模型是个错误。

2025-11-20 11:03:12 664

原创 重磅!中科院信工所首发,LLM幻觉“终结者”来了!5类+18因+10策,一篇封神!

该论文是首篇针对大语言模型代理(LLM-based Agents)幻觉问题的全面综述,系统梳理了幻觉的分类、成因、缓解与检测方法,并指出了未来研究方向,为构建更可靠的代理系统提供了关键参考。

2025-11-20 11:02:33 623

原创 Agent的“开放世界”革命!从《塞尔达传说》看懂上下文工程,Claude Skills就是那个“希卡之石”。

Claude Skills 的发布,无疑是 2025 年 AI Agent 领域的一颗重磅炸弹。尽管 Anthropic 的有些主张颇受指责,但你可以永远相信这个团队在 LLM 以及 Agent 领域的思考和实践,在模型之外的引领是远超于 OpenAI。Claude Skills 则是他们在 MCP 之后推出的又一个新范式。

2025-11-20 11:01:05 914

原创 不愧是Google内部疯传的AI Agent手册,真的好清晰!

Agent的学习全流程已经整理好了,练完这些你的Agent就牛了

2025-11-19 14:42:59 326

原创 大模型的“母语”?不是代码,不是JSON,而是你每天都在用的Markdown

在之前介绍RAG的文章中,不止一次的提到过在知识库的建设中,使用markdown作为主要的存储格式;原因就在于一个现象,明明数据格式有那么多,为什么大模型选择了markdown格式?

2025-11-19 10:10:51 775

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除