【AI落地】如何创建字节的coze扣子工作流 ——以“批量获取抖音视频文案”为例

扣子coze,是字节跳动提供的一个 AI 应用平台,可以类比为一些三方开发者工具平台,比如 xcode + 苹果应用商店,Android Studio + 各大 Android手机应用商店(vivo oppp 小米 blabla)

本 bot最终成品:
批量获取抖音视频文案

一、需求维度出发—我想要“批量获取抖音视频文案”

1、需求背景

抖音上有很有 nb 的大佬分享了很多有趣有用的个人观点,但是视频实在太长了,我想缩短获取大佬们想法的时间。
一个思路诞生:
是否可以通过输入抖音链接,直接获取视频中的文本(字幕)内容?

2、 方案调研
(1) 插件—链接读取 LinkReaderPlugin

coze 扣子官方提供了N多插件,其中有个插件完美解决问题,就是LinkReaderPlugin。

插件—链接读取 LinkReaderPlugin,功能主要是 :
当你需要获取网页、pdf、抖音视频内容时,
使用此工具,可以获取url链接下的标题和内容。

(2)coze 工作流

那LinkReaderPlugin这个插件很好,但又不够好。
比如:
问题 1:返回的数据太多太乱,还有重复的。
它实际返回内容是:标题、作者、视频 ASR 文本、视频或图片 OCR 文本
我想要的只有:视频或图片 OCR 文本

问题 2:
只支持发 1 个视频链接解析,那我有 100 个视频需要解析呢?
难道要需要输入 100 次吗?多累人。

so 这要咋办?
[工作流] 上场。

二、使用 coze 扣子工作流创建一个 bot 完整流程

1、创建 1 个 bot

在这里插入图片描述
在这里插入图片描述

2、编排这个 bot (就是写提示词 prompt,利用大模型)

在这里插入图片描述

3、给 bot 增加技能(其实就是额外实现功能)

如果不需要定制化处理,可以直接在插件里选择LinkReaderPlugin,然后直接对话就可以。
在这里插入图片描述
但是,我们有定制化需求(就是需要解决上面:一 - 2 - (2)中的问题)
那就直接上工作流:// 这里是我已经写好的工作流,可以点击+号创建工作流
在这里插入图片描述

4、 写一个定制化工作流

在这里插入图片描述
在这里插入图片描述

(1)工作流的创建过程(明确 N个节点)
  • 开始
  • 插件
  • 代码
  • 结束

这几个节点需要关联起来,就是用线连起来,这样数据就可以正常流转啦。

(2)“开始”节点配置说明

在这里插入图片描述
开始节点,就是指定输入内容,我们这里是输入视频 url,并且 url 为 array类型。

(3)“插件”节点配置说明

在这里插入图片描述
这里通过使用"批处理",实现了处理多个视频链接的逻辑。
这里主要是引用"开始"节点传入的 urls。

(4)“代码”节点配置说明

在这里插入图片描述
这个节点就是处理插件获取到的视频文本数据,解决上面提到的第 1 个问题。
过程还是取“插件”节点传入的返回数据 + 代码部分写个函数处理返回数据 + 指定输出内容。

// 代码部分,需要注意不要在 1 行中调用多个方法,可能会直接报错。

(5)“结束”节点配置说明

在这里插入图片描述
这里其实是回答的返回数据构造,取上一个代码部分的返回数据,构造成我想要的回答结构。

(6) 所有节点都可以分别调试,确认数据是否正常

整体调试完成后,就发布这个工作流。

5、 在 bot中调用这个工作流,然后调试预览确认最终效果

效果如下:在这里插入图片描述

文本内容其实还能优化,但已经满足我的预期了,不需要再费时间在这上面啦
请添加图片描述
so 一个 coze 扣子创建过程完美整完!
happy happy happy~

豆包PC 版邀请码:8344ELX
请用我的邀请码!好嘛好嘛好嘛

<think>好的,我需要帮助用户解决如何批量提取并下载音视频链接的问题。首先,根据用户提供的三个引用,看起来已经有一些相关的技术方法和脚本存在。我需要将这些信息整合起来,提供一个结构清晰的回答,同时生成相关问题。 首先,用户引用的内容提到使用阿里云的API提取文案,以及使用Python脚本下载无水印视频。需要将这些步骤分解开来,可能分为提取链接和下载视频两部分。另外,引用3中提到了处理视频链接的有效期问题,需要保存文件而不是依赖链接,这可能涉及到解析真实视频地址的方法。 接下来,我要确保回答符合系统级指令,比如使用正确的LaTeX格式,生成相关问题,以及引用标识。需要检查是否有技术细节需要解释,比如如何获取视频链接、使用requests库发送请求,以及如何解析JSON数据获取真实地址。 可能需要注意的点包括:的反爬机制,比如可能需要处理headers中的User-Agent和Cookie;视频链接的规律,如引用3中提到的找到请求网址的规律;以及批量处理的实现,比如循环处理多个链接并保存文件。 然后,回答的结构需要分步骤,比如第一步提取链接,可以通过分享功能获取短链接,然后转换为真实链接;第二步下载视频,需要处理无水印的真实地址。同时,每个步骤给出代码示,并说明注意事项,如反爬措施和文件保存。 最后,生成的相关问题需要围绕技术实现、工具推荐、处理反爬以及应用场景展开,确保问题与主题相关,并且能够引导用户进一步探索。 现在需要将这些思考整理成符合要求的格式,确保使用中文,正确引用,并添加相关问题。同时,检查LaTeX语法是否正确,虽然这个问题可能涉及较少的数学公式,但如果有变量或代码结构,可能需要适当使用行内公式。</think>### 批量提取并下载音视频链接的技术方法 #### 1. 提取视频链接 音视频链接通常以短链形式存在(如 `https://v.douyin.com/xxxxx`)。批量提取可通过以下步骤实现: - **手动/自动采集**:通过用户分享功能获取短链接,或使用自动化工具模拟用户滑动操作抓取页面链接[^2][^3]。 - **短链转真实地址**:通过解析短链接获取视频唯一标识符(如 `itemId`),构造真实视频请求地址: ```python import requests short_url = "https://v.douyin.com/JJ8b6Hq/" response = requests.head(short_url, allow_redirects=True) real_url = response.url # 获取重定向后的真实URL ``` #### 2. 下载无水印视频 的真实视频地址通常需要解析接口数据。核心步骤如下: - **调用解析接口**:通过API或第三方解析服务获取无水印地址: ```python video_api = f"https://www.iesdouyin.com/web/api/v2/aweme/iteminfo/?item_ids={item_id}" response = requests.get(video_api, headers=headers) video_url = response.json()['item_list'][0]['video']['play_addr']['url_list'][0] ``` - **替换地址参数**:将获取的地址中的 `playwm` 改为 `play` 可绕过水印[^3]: ```python clean_url = video_url.replace("playwm", "play") ``` - **批量下载**:使用 `requests` 或 `wget` 下载并保存文件: ```python with open(f"video_{item_id}.mp4", "wb") as f: f.write(requests.get(clean_url).content) ``` #### 3. 关键技术点 - **反爬处理**:需设置请求头中的 `User-Agent` 和 `Cookie` 模拟浏览器行为。 - **文件管理**:按用户/时间分类保存视频、频和文案文件(引用[^1]的方案可整合)。 - **效率优化**:使用多线程或异步请求加速批量下载。 $$ \text{完整技术路径:采集短链} \rightarrow \text{解析真实地址} \rightarrow \text{下载存储} $$
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值