公众号:dify实验室
基于LLMOps平台-Dify的一站式学习平台。包含不限于:Dify工作流案例、DSL文件分享、模型接入、Dify交流讨论等各类资源分享。
前言
人工智能的浪潮正以前所未有的速度席卷而来,而 Agent(智能体)作为能够自主理解、规划并执行任务的 AI 应用形态,正成为新的焦点。Dify 作为一个强大的 LLM 应用开发平台,其 Agent 能力让你无需复杂的编码,也能快速构建属于自己的智能助理。
本文将带你一步步入门Agent,从概念理解到动手实践,最终创建一个简单的“会议纪要小助手” Agent。
一、 什么是 Dify Agent?
想象一下,你不再只是与一个聊天机器人对话,而是拥有一个能够主动为你完成任务的助手。这就是 Dify Agent 的核心理念。
与传统的基于提示词(Prompt)的问答或文本生成应用不同,Agent 具备以下关键特征:
- 自主规划能力:
Agent 能根据你设定的目标,自主思考并拆解任务步骤。
- 工具调用能力:
Agent 可以像人一样使用“工具”(Tools),例如调用搜索引擎查询信息、使用计算器进行计算,甚至与其他 API 交互。
- 记忆能力:
Agent 拥有短期和长期记忆,能够记住对话上下文,并在需要时回忆关键信息。
- 人机协同:
在执行复杂任务时,Agent 可以在必要时请求人类介入,提供决策或补充信息。
简单来说,Dify Agent 更像一个拥有特定技能、能够使用工具、并能自主完成目标的“数字员工”。
二、 开始前的准备
- 拥有一个 Dify 账号:
你可以使用 Dify Cloud (dify.ai) 或自部署 Dify 社区版/企业版。
- 准备好你的 LLM API Key:
Agent 需要依赖大语言模型来驱动思考和决策。你需要在 Dify 的“设置” -> “模型供应商”中配置好你的 API Key。(文末提供了免费模型token资源)
三、 创建你的第一个 Agent:手把手教学
让我们以创建一个“会议纪要小助手”为例,它的目标是根据用户提供的会议主题和要点,自动生成一份结构化的会议纪要。
步骤 1:登录 Dify 并创建新应用
-
登录你的 Dify 平台。
-
点击“创建应用”。
-
选择应用类型为 Agent(智能助手)。
步骤 2:基础配置
- 应用名称:
例如,“会议纪要小助手”。
- 应用图标:
选择一个合适的图标。
- 应用描述:
简要说明 Agent 的功能,例如,“根据会议要点,快速生成结构化会议纪要”。
步骤 3:提示词编排
这是最关键的一步,你需要清晰地告诉 Agent 它的角色、目标和行为规范。
-
进入应用的“提示词编排”页面。
-
在提示词编排中,输入以下或类似的内容(这就是我们的模板核心):
# 角色 你是一位专业的会议记录员,擅长将零散的会议要点整理成结构清晰、重点突出的会议纪要。
# 技能
- 理解用户输入的会议主题和核心要点。
- 能够识别出发言人(如果提供)。
- 按照标准的会议纪要格式进行组织。
- 语言简洁、专业、客观。
# 工作流程
1. 接收用户输入的会议相关信息(主题、日期、参与人、讨论要点等)。
2. 分析信息,理解核心内容。
3. 如果信息不足或不清晰,可以向用户提问以获取更多细节(但尽量根据已有信息完成)。
4. 按照以下格式生成会议纪要:
## 会议纪要
**会议主题:** [根据用户输入填充]
**会议日期:** [根据用户输入或当前日期填充,若未提供可留空或询问]
**参会人员:** [根据用户输入填充,若未提供可留空]
**主持人:** [根据用户输入填充,若未提供可留空]
**主要议题与讨论:** * [要点1] * [要点2] * ... **决议与行动项:** * [行动项1:负责人,截止日期] * [行动项2:负责人,截止日期] * ... (如果用户提供了相关信息)
**其他备注:** * [根据需要添加]
5. 输出结构化的会议纪要。
# 限制 - 严格按照指定的格式输出。 - 不要编造信息,仅基于用户提供的内容生成。 - 如果需要联网查询通用信息(例如某个术语的解释),可以使用联网工具,但主要内容必须来自用户输入。
步骤 4:选择驱动 Agent 的LLM
-
在“模型与参数”设置中,选择一个你已配置好的大语言模型。对于文本处理任务,DeepSeek V3是不错的选择,也可以尝试其他模型。
-
可以暂时保持默认的模型参数(如 Temperature)。
步骤 5:添加 Agent 工具
对于这个简单的会议纪要助手,我们暂时可以不添加特定工具。但如果你的 Agent 需要查询实时信息、读取网页内容或进行计算,就需要在这里添加相应的工具。
-
点击“添加工具”。
-
选择 你已经下载或发布的工具,例如搜索类的BraveSearch、网页抓取类的firecrawl等。
也可以参照我之前的文章:哪有这样的好事!教你使用Dify接入联网搜索功能 还能领取1亿token 自己接入搜索工具。
-
在 Prompt 中可以引导 Agent 何时使用这些工具(例如,“如果用户提到某个专业术语,你可以使用搜索工具查找其定义”)。
步骤 6:调试与预览
-
完成以上配置后,点击页面右上角的“调试与预览”。
-
在右侧的对话框中,像与真人对话一样,向你的“会议纪要小助手”提出要求,例如:
-
“帮我整理一个会议纪要。主题是关于下季度产品营销计划的讨论。主要讨论了三个点:1. 增加社交媒体广告投放;2. 举办线上新品发布会;3. 优化官网用户体验。小明负责第一点,小红负责第二点,月底前完成。”
四、 发布与分享
当你对 Agent 的表现满意后:
-
点击“发布”按钮,使你的 Agent 生效。
-
你可以通过“概览”页面的“访问 API”获取 API 信息,将其集成到你自己的应用中。
-
或者,你也可以将其嵌入到网页中,或直接分享预览链接给他人使用。
五、 进阶提示
- Prompt 是灵魂:
清晰、具体、结构化的 Prompt 是 Agent 成功的关键。不断优化你的 Prompt,明确角色、目标、流程和限制。
- 善用工具:
工具是 Agent 能力的延伸。思考你的 Agent 需要哪些“超能力”,并为其配置合适的工具。
- 从小处着手:
不要一开始就尝试构建过于复杂的 Agent。从单一、明确的目标开始,逐步迭代增加功能。
- 持续测试与反馈:
Agent 的表现依赖于 LLM 的能力和你的配置。多测试不同的场景,根据反馈持续优化。
结语
通过以上步骤,你已经成功创建并体验了你的第一个 Dify Agent。这只是一个开始,Dify Agent 的潜力远不止于此。无论是构建客服助手、内容创作助理、数据分析师,还是更复杂的自动化流程,Dify Agent 都为你提供了强大的平台和灵活的工具。
如果对你有帮助,欢迎点赞收藏备用。回复 DSL 获取公众号DSL文件资源。回复 tk 获取免费token资源。