【AI】DeepSeek+Dify构建知识库、Agent(智能体)、工作流、聊天助手

昨天看到一个网友说"不会使用DeepSeek,那么这东西到普通人手里,就是百度Plus版",这么说也不无道理。为什么DeepSeek会掀起这么大的浪潮,是因为过去我们想实现的很多事情都要基于机器对自然语言的理解,比如机器人发展了很久,现在有了机器狗、人形机器人,但还是需要遥控去控制,而不具备自主思维。再比如刚出来的Gpt、文心一言,更像是拼凑起来的文字,具有浓重的程序化风格。

DeepSeek的优势就在于其推理模型,能够从用户角度出发,分析用户为什么提出这个问题,用户需要达成什么样的目标,以及在回答过程中需要注意什么。这就给很多领域提供了AI驱动的能力,比如散户也可以拥有属于自己的股票分析专家,公司可以基于DeepSeek将传统业务升级为AI驱动,用户只需要一句话就可以得到想要的结果,即使不能做到百分百满意,那也在效率提升上做到了突破。

今天的这篇文章之所以说这么多,是为了交代背景,个人如何深度利用包括DeepSeek在内的AI工具,如何使用构建自己的聊天助手、智能体、工作流来提升工作效率。接下来我将会用系列文章教会你深度利用AI。

DeepSeek

​ DeepSeek大家已经非常了解了,这里就不多介绍了。

Dify

​ Dify平台简单来说,就是一个让普通人无需编程就能快速搭建职能助手或自动化流程的AI工具平台,像拼积木一样简单。Dify平台能够整合知识库、AI模型和工具,自动处理复杂任务(如回答咨询、分析数据),并像人一样学习和优化效果。

1、Dify的部署

Dify支持Linux或MacOS,Windows用户可能需要使用WSL(Windows Subsystem for Linux)。如果大家没有编程能力或者linux环境的话,我也给大家提供了一个我自己在虚拟机上部署的镜像,里面已经用Docker安装了Dify和DeepSeek,大家可以下载下,将镜像导入到虚拟机中即可使用,链接我就放在文末了 。如果需要技术支持,也可以后台回复“交友”,获取我的联系方式。

2、Dify的主要功能

》》 探索页面

探索页面是展示Dify中内置的一些能力,有助手、写作、编程、人力资源等方面的智能体、工作流、聊天助手。当自己对于Dify无从下手时,可以使用这些能力先试试看。

img

Dify-探索

》》 工作室

工作室中包括了聊天助手、Agent、工作流,可以在工作室中根据自己的需求创建相关应用。后面会对该功能做详细解释

img

Dify-工作室

》》 知识库

知识库中可以上传个人或企业的文件,上传之后如果设置了嵌入向量模型,会将文本转换为向量数据,用于后续相似性检索。

img

Dify-知识库

》》 工具

Dify的工具是指一些让AI调用外部功能的插件,比如搜索、发微信或者查询数据,就像给AI装上手和脚,能自动执行现实任务。也可以自定义工具给Dify调用,或者将已发布的工作流发布成工具进行使用。

img

Dify-工具

知识库

​ 知识库是存储企业或个人资料的数据仓库,用于辅助AI精准回答专业问题。原理是将文档拆分、向量化存储,通过检索匹配用户问题,结合大模型生成可靠答案。

1、创建知识库

img

2、选择数据源

​ 数据源可选导入已有文本、同步自Notion内容、同步自Web站点(暂未上线)

​ 导入已有文本:即你需要作为外部知识让大模型去检索回答的内容,可能是个商业计划模板、也可能是个销售数据表。

​ 同步自Notion内容:Notion是一款团队协作工具,类似于钉钉文档、语雀文档等,可以在其中以高度自定义的方式组织工作、管理项目和存储信息。也有提供API给其他应用调用。这里就是Dify对接了Notion,可以从Notion中导入信息到知识库中

img

3、文本分段与清洗

​ 此步骤主要是对上传的文档进行分段以及向量转换

img

img

img

4、处理并完成

​ 此步骤可以修改知识库名称

img

5、查看文档

​ 在列表中可以查看刚刚上传的文档,如果文件比较大,状态可能还是“索引中”,正常是“可用”,右侧也可以进行分段设置、归档等操作。

img

img

6、召回测试

》》 向量检索

​ 上传文档之后我们可以在召回测试窗口问个问题,已测试下命中率吧。我根据文档内容问了“DeepSeek是什么?”,并以向量检索的方式进行检索,命中三个分段

img

如果我问一个不相关的问题,通过向量检索的方式也是可以找到的,但实际结果可能没那么理想

img

》》 全文检索

当我切换为全文检索时,其搜索效果竟然更准确

img

img

》》 混合检索

混合检索需要设置一个重排序模型,如果本地没有安装的话,可以选择使用jina的API。

img

选择添加之后会跳出一个弹窗,可以点击“从Jina获取API Key”

img

进入官网,无需注册登录,点击API

img

查看API密钥

img

复制填充即可

img

设置完成,等几秒钟加载即可,点击保存

img

查看结果

使用混合检索,查询出来的结果相对精确一些,经过重排序模型排序之后,结果会以相似度排序展示。

img

img

PS :一般来说向量检索的结果会更加精确,但我测试的结果却不是(这也证明我不是AI写的文章,纯真实纯手写 )我觉得应该是我材料数量比较少导致的,大家可以多试试

这时候知识库已经设置好了,知识库可以在之后的应用中进行引用。

聊天助手

​ 聊天助手是直接和用户对话的AI,通过大模型理解问题并生成回复。原理是实时调用AI模型分析上下文,用自然语言交互解决咨询、问答等需求。

输入应用名称,点击创建

img

》》 编排

进入编排页面

​ 既然我们是聊天机器人,先设置一个开场白,点击开启,我是设置成了“欢迎来到DeepSeek的世界”

img

设置知识库为上下文

img

记得点击右上角的更新、发布,否则修改将不会生效

img

我们来问下“DeepSeek是什么”,回答就是基于知识库来的

img

可以根据知识库中的测试来验证下

img

》》 访问API

当我们配置完成之后,可以通过API嵌入到应用中

img

API使用需要密钥,右上角创建即可

img

》》 日志与标注

日志记录了应用的运行情况

img

》》 概览

概览就是看下API的使用情况

img

至此,聊天助手算是基本创建完成,需要更完整的能力,就需要你来自己尝试下了。

Agent(智能体或智能代理)

​ Agent是能自动处理复杂任务的AI助手,比如查数据或操作其他软件。原理是预设规则或学习用户目标,拆解任务后调用工具(搜索、API)自主完成

输入应用名称,点击创建

img

》》 编排

输入提示词,即你希望这个智能体帮你完成什么任务

img

选择工具,智能体就是让AI使用工具完成任务的具体存在,所以会有很多工具可选

当然,如果你懂编程,也可以自定义工具

img

img

选择完工具,点击右上角的更新发布即可完成

我们来测试下吧,我创建的是个股票分析智能体,我问了下“大前天苹果的股价情况”

思考的过程中会发现已经在使用工具,时间工具和股票分析工具

img

哎,你猜怎么着,它没回答出来,不管它了,我的电脑也就这样了,只要大概的流程说清楚就行

img

》》 访问API、日志与标注、概览

功能相似,不做过多介绍

工作流

工作流是把多个AI步骤串联起来的自动化流水线,比如先分类再生成内容。原理是用可视化流程编排不同工具和模型,按顺序执行任务,像工厂流水线一样协作。

选择工作流,输入应用名称,点击创建即可

img

》》 编排

默认进来展示开始节点和下一节点选择

img

在开始节点设置下变量,也就是我们要进行对话,工作流需要接收到我们问的内容,需要有个参数来接收

img

这里我选择段落,因为文本的字数有限,段落字数默认最大33024,命名为message

img

第二个节点选择知识检索,引入我们创建的知识库

img

知识库检索的内容将会作为输出变量输出,同时也会作为输入变量被下一节点使用

img

第三个节点选择大语言模型LLM,需要切换模型至deepseek

img

LLM中接收上一节点的输出参数,并设置提示词

img

LLM的输出参数也将作为输入参数被下一节点使用

img

最后的节点选择结束节点

选择大模型输出的变量即可

img

点击右上角的更新、发布,再点击运行

img

输入“DeepSeek是什么”,将会根据知识库信息进行返回

img

我们通过知识库中的分段信息确认下其是否使用知识库回答

img

》》 访问API

Dify提供了对应的工作流API,可以嵌入到应用中进行使用,方法与前面介绍的聊天助手相似

img

》》 日志及概览

日志和概览也都是对API的监控,不做过多介绍

至此,工作流也介绍完了

​ 上面的流程基本涵盖了Dify的基本功能,也包括了DeepSeek的深度使用,例子很简单,但想要真正提效,还需要结合自身业务深入实践

​ 这篇文章花了我两天时间,中间遇到服务不可用,回答不准各种问题,我还是硬着头皮写下来了,只因为我只做有价值的内容,这些内容就是信息差。

DeepSeek 无疑是2025开年AI圈的一匹黑马,在一众AI大模型中,DeepSeek以低价高性能的优势脱颖而出。DeepSeek的上线实现了AI界的又一大突破,各大科技巨头都火速出手,争先抢占DeepSeek大模型的流量风口。

DeepSeek 的爆火,远不止于此。它是一场属于每个人的科技革命,一次打破界限的机会,一次让普通人也能逆袭契机。

DeepSeek的优点

read-normal-img

掌握DeepSeek对于转行大模型领域的人来说是一个很大的优势,目前懂得大模型技术方面的人才很稀缺,而DeepSeek就是一个突破口。现在越来越多的人才都想往大模型方向转行,对于想要转行创业,提升自我的人来说是一个不可多得的机会。

那么应该如何学习大模型

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。

read-normal-img

掌握大模型技术你还能拥有更多可能性:

• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把都打包整理好,希望能够真正帮助到大家。

如果你对AI大模型应用感兴趣,这套大模型学习资料一定对你有用。

1.大模型应用学习大纲

AI大模型应用所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

2.从入门到精通全套视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。
在这里插入图片描述
在这里插入图片描述

3.技术文档和电子书

整理了行业内PDF书籍、行业报告、文档,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

请添加图片描述

朋友们如果有需要全套资料包,可以点下面卡片获取,无偿分享!

### 配置 Dify 知识库工作流 Dify 是一种基于 AI 的工具,能够通过其强大的工作流功能实现复杂任务的自动化处理。以下是关于如何配置和使用 Dify 知识库中的工作流的相关说明。 #### 工作流的核心机制 工作流的设计遵循了一种循环模式:大模型读取数据、解析输入、调用外部工具或 API 来获取额外的信息、生成中间结果并将该结果返回到大模型中进一步分析,直到得出最终结论[^1]。这种流程使得复杂的多步推理成为可能,并允许动态调整每一步的行为。 #### 并行处理能力增强 自版本 v0.8.0 开始,Dify 支持多种类型的并行执行方式来优化性能,包括但不限于简单并行、嵌套并行、迭代过程中的并行以及条件触发下的并行操作[^2]。这意味着用户可以根据实际需求灵活定义不同分支的任务逻辑,在提升效率的同时保持较高的灵活性。 #### 实际应用案例 假设我们需要构建一个用于客户支持查询的知识管理系统,则可以通过如下步骤设置相应的工作流: 1. **初始化请求接收** 当接收到用户的自然语言提问时,启动整个流水线的第一阶段——理解意图。 2. **信息检索与匹配** 利用内置搜索引擎快速定位最接近目标主题的文章片段或其他形式的数据源作为候选答案集的一部分。 3. **结构化数据分析** 如果某些特定字段需要更精确地提取出来(比如价格表),则可引入专门定制化的正则表达式或者第三方 NLP 库完成此部分任务。 4. **综合判断及反馈生成** 将上述各环节产生的子成果汇总起来交给核心算法做最后裁决,形成易于被人类接受的回答格式呈现给终端使用者。 ```python from dify import Agent, Workflow def configure_workflow(): agent = Agent() workflow = Workflow(agent=agent) # 添加简单的串行节点 workflow.add_step("read_input", lambda data: parse_user_query(data)) workflow.add_step("fetch_data", fetch_relevant_documents) workflow.add_step("analyze_results", analyze_and_summarize) # 定义并行任务 parallel_tasks = [ {"name": "task_a", "func": task_function_a}, {"name": "task_b", "func": task_function_b} ] workflow.add_parallel_steps(parallel_tasks) return workflow def run_example(workflow_instance): input_data = get_user_request() # 获取用户输入 result = workflow_instance.execute(input_data=input_data) send_response_to_user(result) # 发送响应至前端界面 ``` 以上代码展示了基本框架搭建方法论之一,其中涉及到了几个重要概念如 `Agent` 和 `Workflow` 类型对象实例化及其相互关系绑定;同时也体现了如何向序列添加常规顺序动作项以及怎样声明一组并发运行的小单元组群。 #### 注意事项 - 在规划具体实施方案之前,请务必仔细阅读官方文档里有关于最新特性介绍的部分,因为随着软件不断升级改进可能会有新的参数选项加入进来影响既有策略效果评估标准变化等问题发生。 - 对于初学者来说建议从小规模试验起步逐步积累经验后再尝试更大范围部署以免造成不必要的麻烦损失。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值