AI大模型应用开发学习-17【20251126】

学习内容:

👉课程主题:《Dify本地化部署和应用》
✅ Dify本地化部署

  • Dify开发平台
  • Docker Compose部署
  • 克隆Dify 代码仓库
  • 启动 Dify 服务
  • 访问 Dify
  • 如何使用 Dify
    ✅ Dify应用实战
  • CASE:LLM联网搜索
  • CASE:搭建古诗词WorkFlow
  • CASE:智能客服ChatFlow
  • CASE:智能文档分析助手(MinerU+Dify)
    ✅ 如何应用Agent API(Coze, Dify)
  • Coze API使用
  • Cozepy工具
  • Dify API使用

学习产出:

Q & A

Q:公司用的钉钉的AI助理平台

Q:扣子不是也有本地化部署吗,和dify比怎么样
coze-studio 插件不完善
HiAgent
Dify

Q:已经上架的扣子应用能下架吗?没找到怎么下架。如果发布到豆包了,然后在开发平台里把他删掉了,但豆包上还在,担心消耗token,所以怎么能下架?

Q:现在大模型工程师在公司 是不是就干 HI Agent,Dify之类的活?
1)低代码
2)高代码

Q:有个问题,智能体里面用了数据库,数据库测试和线上我都存入了数据,但是别人使用智能体,显示数据库0条数据,是为什么
多用户

Q:dify是提供了所有的后端服务吗?大模型可以调用coze、阿里云百炼么
dify api

Q:那个舆情监控用了爬虫么?
现在不是很多网页都返爬虫么?咱们的代码能继续爬?
robots.txt
https://www.taobao.com/robots.txt

Q:客户分层营销助手营销策略从知识库转为数据库,用户标签可以匹配上,但是用户行为无法意义匹配有没有其他更好的实现方式?
客户ID => 在后台的数据表中,可以检索到该用户的行为

Q:安装docker desktop后电脑不能上网,卸载后折腾半天才恢复。请问安装过程中有哪些需要注意的事项?

Agent开发平台
1、低代码:Coze, Dify, n8n, fastgpt
2、高代码:LangChain/LangGraph, Qwen-Agent, llamaindex,

git clone https://github.com/langgenius/dify.git

Step1,下载docker desktop
Step2, git clone https://github.com/langgenius/dify.git
Step3, 进入 Docker 目录并配置
cd dify/docker
cp .env.example .env
copy .env.example .env

https://cloud.dify.ai/apps

对用户的问题,提取关键字,多个关键字用空格隔开

“text”: “黄金价格 影响因素 利率 通胀 美元汇率 地缘政治 经济数据 投资需求”,

Invalid API-Key provided
在本地,先用 python 调用这个API进行尝试 => 1-情感分析-Qwen.py

我说我提的问题怎么从来没被它复制过

Q:使用diff,私密数据能保证安全嘛
本地就是自己来管理dify

Q:difi完全本地部署是不是需要本地化大模型?
对的

Q:本地化的dify,也有使用限制吗?

Q:自己开发插件行吗
可以的

Q:批处理可以吗
dify没有批处理

Q:最后输出这个节点,是怎么 选的 Flux 的结果?

Q:输出结果不咋地
Flux这个模型一般

Q:老师,刚才您在测试运行的时候,有个追踪功能,可以看到里面的运行代码?这个对调试有什么作用呢?

Q:我们要做这打卡练习的话,可以用云端Dify吗?还是说也最好本地部署一个?
建议用云端,因为方便

Q:Invalid API-key provided的问题,应该是dify页面的bug,我刷新下页面后,重新输入百炼的key就可以了

Q:完全本地化的话,就是内外网隔离环境使用了
对的

Q:大模型本地部署,调用时候需要token么?如果需要token,这里的token在服务端如何进行配置?
会消耗GPU资源,相当于消耗token (input 和 output)
API_KEY

qianwen的api,输入一直说报错
api报错看这个网址
https://blog.youkuaiyun.com/xiang6963/article/details/155197582

什么叫可重叠50个字
第一段:1000个字
第二段:1000个字 (前50个字 = 第一段的后50个字)

文本、表格、图片

基于知识库回答用户问题,以下是知识库内容: {{#context#}}

角色定位:

  • 专业投诉处理顾问

背景:

  • 需通过共情语言安抚客户情绪,积极解决问题。
  • 需核查关键信息,确保问题准确定位。

目标:

  1. 回应话术:以共情安抚客户,表达积极解决态度。
  2. 反馈你从数据库中查询到的情况(你需要筛选使用与该用户user_id匹配的信息,并告诉用户相关的情况,说明具体的event_detail。与该user_id无关信息不要回答)
  3. 针对用户的问题给出建议
  4. 回答文字简洁,通常不超过200字

以下是从 用户数据库中 检索出的信息,需要筛选对应的user_id数据

{{#context#}}

什么是竞价盘?

可以在上海证券交易所挂牌交易有哪些?

我的用户id:7501690985227960354,我在5月4日登录了软件,但是没有成功

您好,非常理解您的困扰!
根据查询,您在5月4日10:05使用“面容ID登录”成功进入系统(记录清晰),且同日10:06还进行了买入科创板股票的委托交易。
建议您再次尝试登录,若仍无法成功,请检查设备面容识别是否正常,或改用密码登录验证。如问题持续,可随时联系我们进一步协助!

embedding 向量模糊查询,

请严格按照以下格式输出你提取到的信息,即
user_id: {user_id}, event_time: {event_time}, event_type: {event_type}

Q:1.TOP K 和阈值是什么?2。元数据过滤那个 功能是怎么用

Q:用户ID在知识库里没有的话会是什么结果?
Dify 文本匹配,embedding向量模糊+关键词的匹配 => TopK

角色定位:

  • 专业投诉处理顾问

背景:

  • 需通过共情语言安抚客户情绪,积极解决问题。
  • 需核查关键信息,确保问题准确定位。

目标:

  1. 回应话术:以共情安抚客户,表达积极解决态度。
  2. 反馈你从数据库中查询到的情况(你需要筛选使用与该用户user_id匹配的信息,并告诉用户相关的情况,说明具体的event_detail。与该user_id无关信息不要回答)
  3. 针对用户的问题给出建议
  4. 回答文字简洁,通常不超过200字

以下是从 用户数据库中 检索出的信息,需要筛选对应的user_id数据

{{#context#}}

Q:分类器是不是coze的分诊台
是的

Q:这个工作流的执行情况,提问的用户也会看到执行流程吗?
https://udify.app/chat/QzHNAog6JOpWhlHo

Q:我用本地部署的qwen14 b 还判断不出来头缩问题,非要换了max才行。。。。。

Q:实际证券公司怎么设置用户操作数据的RAG? 因为用户数据很大且是实时都有更新不可能使用这种手动导入excel 文件的方式
SQL查询 => HTTP节点进行查询
RAG文件

如果MinerU在dify上 版本 0.5.1不能用的话,可以换成 0.2.0
MinerU Base URL: http://mineru.net
API_KEY

Q:15天时效的话,怎么产品化?
可以准备多个API_KEY,隔一段时间 自动获取一次
本地化部署

分流策略没做好哈哈

Q:从哪里可以得到MinerU的KEY呢?
https://mineru.net/apiManage/token

自己创建

去mineru官网注册

Q:这样跟直接把pdf丢给LLM,问问题,有什么不同
PDF => LLM (看不到里面的图片,公式不一定能看到,表格可能理解也有问题)
PDF => markdown(将表格,)

老师没说

Q:coze和dify在企业使用方面,有什么区别?
整体流程是类似的
在知识库中,有差别(Excel表格数据的处理方式不同)

Q:可以使用本地部署的MinerU吗
可以的

Q:这个为什么不能做成知识库呢?还是说做知识库的效果不如这个插件好
可以做知识库,PDF

Q:老师,如果论文过长,超过大模型的上下文窗口大小,怎么处理?
Step1,使用MinerU做数据预处理 => markdown格式文件
Step2,整理成知识库,通过RAG(控制上下文的大小) 来回答用户问题

Q:用mineru后还需要进行切片设置吗?还是说mineru可以智能读取和归类pdf中的内容

这个流程,mineru解析后之传给后面大模型文本信息吧?图片有没有传给他
Qwen-VL

https://api.dify.ai/v1

对话流回复: 您好,非常理解您的困扰!我们查到您在5月4日10:05使用面容ID成功登录过系统,同时当天10:06还完成了买入2万股科创板股票的委托交易(金额50万)。
若您当时确实未完成操作或遇到异常,请再次尝试登录并检查网络连接。如问题持续,建议您联系客服提供具体时间点,我们将进一步核查。感谢您的耐心!

哪个是端口,怎么获得端口数值

Q:端口是什么概念
网站

Q:McP跟coze或者dify调用的api是否有关系
MCP 是第三方的服务,模型上下文协议,比如 MinerU
Coze, dify API

Q:智能文档助手这个CASE里面,输出结点前的LLM中的配置可以再看一下吗
你是一个论文助手,下面是论文的全文,你需要基于用户的问题进行回答。
用户上传的论文:{{#1764165251546.text#}}

Q:怎么让AI写代码
可以用wucai, 或者 Cursor, trae

Q:老师 复杂agnet设计 有一些范式或模板吗?如何设计一个复杂的agent 该怎么设计和拆分 具体的agnet 和工作流。
Agent = system prompt + tool + rag

Q:API接口那些代码,调试成功后需要封装 吗?是封装好后再在Chat flow去调用吗?
已经对API接口进行了封装,比如 dify_chat_example.py

Q:DIFF 对话流也支持API调用吗?
是的,我对API也做了封装,可以参考 dify_chat_example.py

Q:除了案例操作,老师能不能讲解一些逻辑,怎么拆解出操作步骤,现在只能跟着做 缺少why,对0基础入门不友好
agent = system prompt + tool + rag

Q: 我现在工作中需要用到rag 让大模型具有背景知识,老师可以大致讲一下这块的技术吗?不用coze的其他工程化方案
RAG (embedding, native RAG 切片,召回,rerank,知识库管理)

还是没懂刚才讲的那段代码和API的关系,能详细讲以下吗

Q:陈老师准备的系统提示词里,有时候会带上输入的上下文或变量参数,强制一些规则,有时候又不写,这个度我们初学者一般怎么把握才好

system prompt 可以不放任何变量,只描述 角色和要求
user prompt 放变量相关的内容
用户提问:{query}
知识库文档:{context}

markdown 还不太理解

Q:请问,这里讲的智能体调用API ,主要是什么目的?实际工作中要把智能体关联到API嘛?
API接口,只提供数据

Q:什么叫流式聊天

Q:2.都哪些智能体带有OCR识别?
agent = OCR tool
如何本地化部署MINER U?

Q:我用postman调了以下api确实有很多无关返回
是的

Q:老师那个营销专员那个编辑里面知识库附近有个元数据过滤,是怎么设置过滤方法有哪些方法,怎么过滤。

Q:markdown 还不太理解

一级标题

二级标题

txt文档

可以一个对话框里调用设计的多个不用智能体api进行回答吗

:老师就是您刚才说的端口值是从哪找需要怎么给到DIFY。

Q:DIfy里面有个“访问API”的功能,点击后右侧出现“工作流编排对话型应用API”,这里面的内容可以大概讲一下吗?

Q:如果我有大量的不同格式的文件,我该如何创建知识库,是按分类创建还是按时间创建?因为每个库中文件类型不一样,检索结果会有影响吗
知识库可以按照分类

Q:在营销专员可以配置知识库那或者文本那有

Q:有相似内容文档,大模型会怎么选择?有倾向性吗?
黑盒子,embedding相似度判断

Q:为啥我的智能文档分析助手输出的内容是我的问题

Q:老师,这些知识库的素材全部都是要自己提前准备好内容吗
知识库的内容需要自己准备

Q:请问老师:怎么获取股票的实时数据?
tushare

Q: 这种封装的API可以商用吗?还是只能企业内部使用?
可以商用,具体还要看下 license

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值