
大模型落地探索及agent搭建
文章平均质量分 81
大模型落地探索及agent搭建
姚瑞南Raynan
AI-agent 大模型运营专家/音乐人/野生穿搭model,先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP证书。丰富的智能交互/AI项目管理/智能解决方案设计/知识库优化/意图识别训练等NLP领域经验,擅长沉淀智能运营及prompt设计、大模型落地探索、标注管理等方法论,较深的AI行业理解力与认知能力,掌握模型训练/大模型评测/智能运营/需求文档及提示词撰写/标注规则与多轮对话设计能力等。
展开
-
【AI风向标】一文搞懂 MCP 和 Tool,才能真正玩转Dify智能体平台
项目MCPTool(工具)定义可调用的后端服务(插件或自建接口)单步功能模块(内置或外部轻插件)典型用途数据查库、调用后端 API、复杂业务逻辑执行翻译、搜索、图片生成、邮箱发送等接入方式需要开发者提供服务 URL,配置请求参数和返回结构直接使用平台已有或接入轻服务功能复杂度多步骤,流程感强单功能,轻量调用可复用性强:适用于多个 Agent 或任务一般只用于当前 Agent 的功能增强。原创 2025-05-20 11:13:41 · 408 阅读 · 0 评论 -
【AI风向标】一文搞懂MCP服务是什么?看AI 如何真正“接入现实世界”
*MCP(Model Context Protocol,模型上下文协议)**是由 AI 公司 Anthropic 于 2024 年提出的一套开放标准协议,它的目标是解决大模型的“信息孤岛”问题,让 AI 不再“闭门思考”,而是能访问并操作真实世界的数据与系统。不论你是开发者、产品经理还是运营,只要你和“大模型落地”打交道,你都绕不开 MCP。它将是连接模型、数据、工具和用户之间的新基建,就像当年 Web 的 API、当下的 SDK 一样,成为 AI 世界的“电网”。原创 2025-05-20 11:08:59 · 1134 阅读 · 0 评论 -
【Prompt实战】让AI读懂客户:打造广告营销对话分析专家!
在实际的客服运营工作中,我们每天都会面对大量客户对话文本。如何快速、准确地从中提取关键信息,进行意图分类并转化为结构化数据,成为提升服务效率与决策质量的关键一环。本篇文章以「广告营销对话内容分析专家」为主题,实战展示了如何通过精心设计的Prompt,将大语言模型变成一位高效的信息收集助手。通过引导模型遵循明确的角色设定、技能描述、规则约束以及多步workflow流程,我们成功将“非结构化”的客服对话,转化为“结构化”的JSON信息,极大提升了客服部门的响应速度与数据分析效率。原创 2025-04-18 11:28:52 · 769 阅读 · 0 评论 -
【Agent平台】DIFY平台API工具list
完成 dify 平台 API 工具的初步整理与筛选,提取全部自定义工具条目并形成标准化结构,便于后续统一判断哪些工具可以对外提供为通用服务。该清单对提升跨团队效率与减少重复建设具有明确价值,并可作为通用工具推广候选池的初始基础。原创 2025-04-16 13:46:32 · 784 阅读 · 0 评论 -
「实战拆解」我用ChatGPT搞定整个季度绩效总结,效率翻倍!
每到季度末,写绩效报告总是一件让人“头大”的事情。既要全面覆盖自己做了什么,又要总结亮点、归纳成果,还得用恰当的语气展示“谦虚中的自信”,一不小心就容易写成流水账,或者显得太公式化。这一次,我决定尝试一个新的思路——让ChatGPT来帮我生成整份绩效报告。信息梳理效率更高:我只需要整理好我做了哪些事,ChatGPT就能快速帮我归纳出逻辑清晰的结构(成果总结、亮点提炼、问题分析);语言表达更精准:比起自己反复琢磨遣词造句,AI生成的内容既专业又得体,还能根据风格需求“自由切换”;节省时间+提升质量。原创 2025-04-10 17:09:14 · 1489 阅读 · 0 评论 -
【Agent实战】打造你的智能工作日志生成助手,效率翻倍不是梦!
我是你的 Markdown 工作日志生成助手,专为你(姚瑞楠)定制,用来 自动生成符合规范的工作日志文件(.md),帮助你高效、清晰地记录每日工作任务。原创 2025-04-09 15:32:33 · 576 阅读 · 0 评论 -
Agent开发攻略篇:智能体技术的突破与实践之路
在接下来的内容中,我们将深入探讨AI Agent开发的核心策略,从架构设计、工具集成到质量保证与成本优化,并通过多个行业的实际案例,为开发者和企业提供一套系统化的Agent开发攻略。本文的核心观点是:成功的AI Agent开发需要系统化的架构设计、精细化的工具集成策略、完善的质量保证体系以及深度的行业场景理解。面对这一挑战,本文提出一个核心观点:成功的AI Agent开发不仅需要先进的技术基础,更需要系统化的架构设计、精细化的工具集成策略、完善的质量保证体系以及深度的行业场景理解。原创 2025-04-02 11:28:12 · 941 阅读 · 0 评论 -
【Prompt实战】广告营销客服专家
【代码】【Prompt实战】广告营销客服专家。原创 2025-03-28 11:15:20 · 518 阅读 · 0 评论 -
4. 如何减少大模型幻觉?⸺大模型外挂向量数据库的分析(知识延伸版)
语言模型(LLM)有两个突出能力:一个是自然语言的理解和生成能力🗣️,另一个是逻辑推理能力🧠。然而,大模型也存在短板,比如大模型会产生幻觉:即大模型的输出内容,与输入内容或现实不相符😵,也就是“大模型在绘声绘色地胡说八道”🎭。不同的应用场景,对大模型幻觉的容忍度不同⚖️。比如,在要求严谨和精确的领域📊,大模型幻觉就是个必解的问题❗原创 2025-03-25 15:46:31 · 1737 阅读 · 0 评论 -
【Agent平台】AI workflow解读(三)
每个步骤都有固定的顺序,如果打乱了顺序,可能会影响整个流程的效率。工作流的魅力在于,它能够将复杂的任务分解成简单可行的步骤。简单的理解为把大模型当做一个“人”,让他按照既定的流程完成一项任务,并取得一定的成果。通俗定义:工作流指的是一系列步骤或任务,通过预定义的顺序和规则,完成特定目标的一种方法。工作流本质上是将"慢思考"的结果固化,使得我们可以用"快思考"的方式快速执行复杂任务。通过工作流,我们实际上是在为AI创建一个"检查清单",大大减少了错误发生的可能性。这正是工作流的精髓所在。原创 2025-03-21 15:40:37 · 1260 阅读 · 0 评论 -
【Agent平台】AI workflow解读(二)
1. 大语言模型(LLM):这是AI Agent的"大脑"。就像人类大脑由上千亿个神经元组成,LLM也由数以亿计的参数构成。这使得它能理解和生成人类语言,解答问题,甚至创作内容。2. 规划能力(Planning):这相当于AI Agent的"前额叶皮质",负责制定计划和决策。例如,当你要求它帮你规划一次旅行时,它能考虑预算、时间、个人喜好等多个因素,给出一个合理的方案。3. 记忆系统(Memory):这就像AI Agent的"海马体",用于存储和检索信息。原创 2025-03-20 18:02:17 · 1176 阅读 · 0 评论 -
一文讲透 MCP(来源 Apifox MCP Server)
当用户和 AI 助手对话,且开启联网搜索后,AI 助手会先将用户说的话发送给第三方搜索引擎,然后将第三方搜索引擎的返回的内容和用户说的话一起提供给 AI 大模型,再由 AI 大模型生成回答。然后设定这样一个工作流:如果有人问 Apifox 的最新版本是多少,则调用这个 API,再将 API 返回的结果和用户的原始问题一起提供给 AI,这样 AI 就可以给出正确的回答了。,再强大的 AI 也只是知道过去发生的事情,却无法实时从外界获取最新的信息,比如今天的天气情况、今天的热点新闻等。原创 2025-03-19 09:00:00 · 1561 阅读 · 0 评论 -
【Agent平台】AI workflow解读(一)
思维链方法是通过中间推理步骤实现复杂的推理能力,将大目标拆解成小目标,一步一步思考计算最后得到最终结果。 就像快递员送货,如果你一下子让他送一个小区的快递,他就会不知所措。但如果把所有快递先分楼栋,再区分快递的类型,他的送货效率肯定会快很多。 一步一步去完成,这就是思维链。原创 2025-03-18 11:51:00 · 1170 阅读 · 0 评论 -
【Dify平台】Function Call 模式模式和ReAct模型有什么不同?
DIFY(Do It For You)是一个低代码/无代码 AI 应用开发平台,支持 Function Call 模式,这种模式主要依赖。ReAct 是一种更高级的智能体(Agent)推理与行动模式,由。"请帮我查询订单 #12345 的状态,并告诉我预计送达时间",DIFY Function Call 更合适。"请帮我查询订单 #12345 的状态"先推理,再决定是否调用 API/工具。单轮调用,通常是一次 API 请求。低,可结合推理减少 API 调用。,ReAct 更合适;较低,API 结构固定。原创 2025-03-17 11:31:41 · 1851 阅读 · 0 评论 -
【Agent实战】发票信息识别提取专家(AI +OCR技术结合ChatGPT4o能力+结构化prompt(CoT、One-shot等)+Knowledge - RAG+API工具Agent项目实践)
本文通过结合AI和OCR、RAG等技术(ChatGPT4o能力+结构化prompt(CoT、One-shot等)+Knowledge - RAG+API工具)可以有效地让人工智能系统理解来自不同客户的发票内容,自动识别并提取出关键数据。这不仅可以帮助企业精确地进行成本控制和物流规划,还能显著提高数据处理的效率和准确性,进一步推动行业向数字化和智能化转型。通过这种技术整合,UNIS等公司能够通过自动化的方式处理大量的发票数据,从而实现成本节约和效率提升。原创 2025-03-14 11:31:26 · 1606 阅读 · 0 评论 -
【Agent实战】货物上架位置推荐助手(RAG方式+结构化prompt(CoT)+API工具结合ChatGPT4o能力Agent项目实践)
成功利用ChatGPT4o版本结合RAG知识库方式,通过结构化prompt(CoT)调用API工具为用户推荐货物上架位置。工具调用数据来自于业务系统。原创 2025-03-13 09:45:00 · 1240 阅读 · 0 评论 -
结合CoT思维链的workflow应用拆解(基于Dify平台)
0-1搭建workflow分步推理将问题拆分出相应的解题步骤,应用效果显著(相比LLM模型直接回复不经过though过程);原创 2025-02-26 10:45:54 · 1446 阅读 · 0 评论 -
一文了解检索增强生成(RAG技术)
向量检索为核心的 RAG 架构已成为解决大模型获取最新外部知识,同时解决其生成幻觉问题时的主流技术框架,并且已在相当多的应用场景中落地实践。原创 2025-02-24 11:58:34 · 744 阅读 · 0 评论 -
【智能客服】大模型话术评测规范(AIGC)
模型生成回复与原始会话回复的相关性跳过某些流程缺少流程某一节点。需要了解流程才能判断缺少哪些节点缺少知识,使得方案错误未识别或识别错用户真实意图,答非所问用户问题和话术完全不匹配。比如:用户问了退款问题,话术给的配送问题;生成话术与上文不衔接、不连续用户问题和话术相关性不大,衔接不上。比如:用户问了退款问题,话术提到了退款,但回答不是退款问题。无法区分角色用户有两个角色,骑手和消费者,问了两个订单,无法区分消费者/骑手角色。原创 2025-02-21 14:11:35 · 1082 阅读 · 0 评论 -
【智能客服】ChatGPT大模型话术优化落地方案
LLM的出现对智能客服是挑战与机遇并存,如何用好LLM的强大能力,提升智能客服机器人的效果,目前没有相对统一的技术路线,需要各方的积极探索原创 2025-02-20 09:45:00 · 1509 阅读 · 0 评论 -
【Agent实战】窗口登记助手(结构化prompt(CoT)+组合API工具结合ChatGPT4o能力Agent项目实践)
成功利用ChatGPT4o版本结合结构化prompt(CoT)调用多种API工具按步骤为用户办理窗口登记。工具使用过程中涉及查询信息和提交信息、绑定信息,5个工具使用过程即。原创 2025-02-18 10:00:00 · 2299 阅读 · 0 评论 -
读懂AI Agent:基于大模型的人工智能代理
⼤语⾔模型的浪潮推动了AIAgent相关研究快速发展,AIAgent是当前通往AGI的主要探索路线。⼤ 模型庞⼤的训练数据集中包含了⼤量人类行为数据,为模拟人类的交互打下了坚实基础;另⼀⽅⾯, 随着模型规模不断增大,大模型涌现出了上下⽂学习能力、推理能力、思维链等类似⼈类思考方式的多种能力。将大模型作为AIAgent的核⼼⼤脑,就可以实现以往难以实现的将复杂问题拆解成可实现 的子任务、人类的自然语言交互等能力。原创 2025-02-15 11:00:00 · 1111 阅读 · 0 评论 -
【agent实战】基于dify平台的订单查询助手
(转载需经授权)原创 2025-02-08 07:30:00 · 996 阅读 · 0 评论 -
【Agent实战】BOL提单识别提取专家(AI +OCR技术结合ChatGPT能力Agent项目实践)
在公司的运输业务中,BOL(提单)是关键文档,标志着运输的开始,并包含重要的运营信息。目前,不同客户使用不同的BOL模板和处理方式。开发一个单一客户的OCR 信息提取方案通常需要约一周时间,然后才能接入RPA的流程。事实上来说,对于我司而言,BOL中的关键信息具有通用性,可以使用AI的文字理解来解决这个问题。 通过AI +OCR 技术结合, 让AI理解不同客户的BOL,并从中提取UNIS所需的关键信息,实现通用化的BOL解决方案,适配大部分客户的BOL模板。此方法确保数据提取的完整性、准确性和稳定性,并可在原创 2025-02-05 15:45:53 · 2740 阅读 · 5 评论 -
AI大模型的100种玩法
代码调试、错误查找、测试用例生成、代码补全、代码库理解、代码翻译、电脑故障排除、软件操作指导、硬件维修指导等`文章大纲生成、文案润色、文本翻译、文章生成、创作灵感激发、广告文案撰写、社交媒体内容创作、产品描述生成、市场趋势分析、营销策略制定、博客文章撰写、新闻稿撰写、筹款方案撰写、职位描述撰写、网页文案撰写等简历修改、面试准备、求职信撰写、模拟面试、邮件撰写、演示文稿制作、会议纪要整理、时间管理、任务安排、会议准备、工作伙伴、自我激励等。原创 2025-01-26 10:07:08 · 1017 阅读 · 0 评论 -
ChatGPT知识库结构范本
主要是该知识点的产生的原因、为什么会有这个知识点的描述。# 围绕规则衍生出来的相关问题和对规则有疑惑的细则解答。# 主要包含那几种规则和处理结果的说明。没有跨日期、不在免费取消时间内、未协商。行业名词或者业务特定名词形成概念释义库。场景知识库形成层级分明的解决流程。# 解决问题完整流程分支列表。标题按照飞书标题格式分层来写。# 知识点的概述/核心诉求。图⽂跳转链接形成图⽂链接库。#⼀些行业名词和释义。原创 2025-01-21 17:53:30 · 288 阅读 · 0 评论 -
ChatGPT结合知识库应用全流程
大型神经网络模型,通常称为“大模型”,特点是它们拥有大量的参数,这使得它们能够处理和记忆大量的信息。GPT 系列在此背景下应运而生,成为了这类模型的杰出代表。特别是 GPT-4;" GPT " 代表 " Generative Pre-trained Transformer "。从这三个单词中,我们可以简要了解 GPT 所采用的核心技术:它是一个基于 Transformer 架构的生成式预训练模型。这种架构能够高效地处理长文本数据,提供深入的语言理解并生成复杂的文本内容。原创 2025-01-21 11:46:07 · 1301 阅读 · 0 评论 -
Zero-shot, One-shot和Few-shot的理解
meta就是描述数据的数据。比如照片,我们看到的是它呈现出来的数据, 即Data,但它还含有许多描述它拍摄参数的数据,比如光圈、快门速度、相机品牌等,即Meta。机器学习模型一般要求训练集样本量足够大,才能取得不错的预测效果。但对于人来说却不需要,对于一个从没有见过小猫和小狗的小朋友来说,给他几张照片他就能轻松的学会如何分辨两只动物。如果一个人已经掌握了如何骑自行车,那么学习如何骑摩托车对他来说会非常轻松。我们能否设计一个模型,让模型仅从一点点训练样本就能学会新的“知识”呢?即让模型“自己学会去学习”原创 2025-01-21 11:25:01 · 855 阅读 · 0 评论 -
如何有效”PUA“大模型 出好结果?
实际上来说,并不应该更加礼貌,而是需要“PUA”大模型才能得到更好的结果。最近看的一篇论文《大型语言模型理解情感刺激并可借此得到增强》研究了如何对大模型进行情感刺激来增强提示(prompt)的效果。在这里也将情感划分为两个维度(社会效应和自尊)包含 11 种类型,分别组合来对比情感是否能够增强提示的效果。但是怎么越看越像是在“PUA”大模型来获取更好的结果呢?如何有效”PUA“大模型看看上面的使用过程是不是像极了作为家长的鸡娃过程,不仅仅要保持耐心,还要给出方法一步一步来,更需要多鼓励。原创 2025-01-21 11:22:32 · 1007 阅读 · 0 评论 -
大模型幻觉正是 AI 聪明的表现
提示启动了梦境,根据 LLM 对其训练文件的朦胧回忆,大多数情况下,梦境的结果都是有用的。总之,我知道我是个超级迂腐的人,但 LLM 不存在 "幻觉问题"。据说 OpenAI 为其起名时,不选择 Mary 这类拟人化的名字,而为其取名 ChatGPT ,就是希望用这样一个生硬古板的名字提醒大家这是一个机器人。在各种场景下,相信 "幻觉" 都是被作为大模型的问题,大模型不好的方面来被阐述的。但是在我看来,机器会撒谎,尤其是能将谎言编织的毫无逻辑漏洞,甚至虚构事实,才恰恰说明了机器的聪明,机器的可怕。原创 2025-01-20 22:53:22 · 488 阅读 · 0 评论 -
【Dify平台】什么是数组变量?
数组变量是一种特定的数据类型,变量内通常包含多个元素。其中的元素用逗号分隔,以 开头,以 结尾。例如:原创 2025-01-20 22:38:19 · 215 阅读 · 0 评论 -
【Dify平台】召回模式设置
当用户构建知识库问答类的 AI 应用时,如果在应用内关联了多个知识库,此时需要应用 Dify 的召回策略决定从哪些知识库中检索内容。召回模式设置。原创 2025-01-20 22:19:58 · 2826 阅读 · 0 评论 -
【Dify平台】Dify实践问题总结
解决:把问题分类器后面加一个变量聚合器再走条件分支。原创 2025-01-20 21:58:21 · 440 阅读 · 0 评论 -
一文了解RAG检索模式
你可以在“模型供应商”页面配置 Rerank 模型的 API 秘钥之后,在检索设置中打开“Rerank 模型”,系统会在混合检索后对已召回的文档结果再一次进行语义重排序,优化排序结果。在将相关度最高的文本内容查找到后,RAG 系统会将其作为用户问题的上下文一起提供给大模型,帮助大模型回答问题。你可以在“模型供应商”页面配置 Rerank 模型的 API 秘钥之后,在检索设置中打开“Rerank 模型”,系统会在语义检索后对已召回的文档结果再一次进行语义重排序,优化排序结果。系统默认值为 3。原创 2025-01-20 21:54:18 · 1355 阅读 · 0 评论 -
ChatGPT里的system,user,assistant有什么作用?
系统提示词是规定大模型的行为和角色设定, 用户提示词是我能给大模型什么信息 背景 问题交代这个不同模块基本就是写提示词的角度不同,系统模块就是模型角度写的提示词,用户模块就是用户角度写的提示,这两个模块协同起来就可以。原创 2025-01-20 21:48:25 · 890 阅读 · 0 评论 -
【Dify平台】基于Dify智能体平台API工具搭建sop
本文讲述基于Dify智能体平台API工具搭建sop,是作者在Dify智能体平台进行agent应用实践及落地总结。作者:姚瑞南 AI-agent大模型运营专家。原创 2025-01-20 18:05:02 · 1009 阅读 · 0 评论 -
如何构建企业级的AI大模型?
模型评估⼀直以来都是⼈⼯智能领域的重要议题。从机器学习,到深度学习,再到现在的⽣成式 AI,不同阶段的模型评估指标也呈现不同的特点。在机器学习和深度学习阶段,模型的主要任务是分类(分类模型)和预测(回归模型),模型结果是否正确是明确的。分类模型的主要评估指标是准确率、召回率、精确率、F1 等等。但是到了⽣成式 AI 阶段,基于通⽤⼤型基础模型,模型的主要任务变成了⽂本⽣成和图像⽣成等。⽣成的⽂本与图⽚是否“正确”具有强烈的主观性,计算维度也与之前不同。原创 2025-01-20 17:57:31 · 984 阅读 · 0 评论