在背景音乐方面,通过关键词搜索获取符合要求的音乐并进行格式化处理。然后,将上述处理得到的背景图、背景音乐、单词信息、人声音频、单词配图及贴纸等元素按照时间线进行整合,生成对应的剪映草稿所需的数据格式。
今天解锁一个有趣的AI英语工作流水,输入单词 == 自动出短视频!

英语教育机构还在手动找图、拼音频、调时间轴?为一个单词视频折腾半小时?

图片
输入单词,AI秒匹配拓展词表 - 大模型智能生成权威释义
图文声一键齐活 - 发音音频、高清图解(AI抠图透明底!)、BGM自动配 时间轴智能对齐 - 语音、字幕、贴纸精准卡点
剪映草稿直接生成 - 导入即用,导出成品只需5分钟!
省下半天时间,多产10条视频引流/教学,它不香吗? 英语老师、知识博主抓紧上车!
一、工作流

图片
该工作流的设计逻辑围绕英语单词相关的视频合成展开,核心目的是根据输入的英语单词生成包含单词匹配、音频、图片及视频草稿的完整视频素材。
首先,从表中查询与输入英语单词相关的匹配单词列表,将其与输入单词一同输入大语言模型,生成符合特定格式要求的单词及释义列表。
接着,对生成的单词列表进行格式化处理,提取单词和释义,再将其合成为音频。
之后,从音频合成结果中提取语音 URL 并获取音频时间线,同时使用大语言模型生成英语单词图片的提示词,经优化后生成图片并抠出透明背景。
在背景音乐方面,通过关键词搜索获取符合要求的音乐并进行格式化处理。
然后,将上述处理得到的背景图、背景音乐、单词信息、人声音频、单词配图及贴纸等元素按照时间线进行整合,生成对应的剪映草稿所需的数据格式。
最后,创建剪映视频草稿,并依次添加背景图轨道、背景音乐轨道、单词信息、人声音频轨道、单词配图及贴纸,完成整个视频合成素材的准备工作。
二、 工作流拆解
1. 查询数据
- 名称:查询数据节点
- 功能:从指定数据库中查询与用户输入基础单词(en_word)匹配的历史匹配单词,输出包含匹配单词的列表(outputList)。

图片
2. 英语单词匹配助手(大模型)
- 名称:大模型节点
- 功能:调用DeepSeek-R1大语言模型,结合用户输入的基础单词(en_word)和历史匹配列表(outputList),生成符合规范的7个匹配单词(包含基础单词、音标、中文释义),输出结构化JSON格式的单词列表(words)。

图片
3. 文案口播数据格式化(代码)
- 名称:代码节点(文案口播数据格式化)
- 功能:处理大模型输出的单词列表(words),提取每个单词的"word"和"meaning"字段,生成格式化的word_list(单词+释义的字符串列表)和first_word(第一个单词的中文释义)。

图片
4. 语音合成
- 名称:语音合成节点
- 功能:调用语音合成插件(speech_synthesis),将word_list作为文本输入,生成音频文件,输出包含音频链接等信息的结果列表(outputList)。

图片
5. 提取语音URL为列表
- 名称:提取语音URL节点(audio_link_collector)
- 功能:从语音合成结果(outputList)中提取音频链接字段(data.lin

图片
- k),输出音频链接数组(links)。
6. 提取文案音频时间线
- 名称:提取音频时间线节点(audio_timelines)
- 功能:分析音频链接(links)的音频内容,生成每个音频段的时间线(包含起始和结束时间,单位微秒)及总时间线(all_timelines)。

图片
7. 文案人声audio_infos(剪映数据生成)
- 名称:文案人声数据生成节点(audio_infos)
- 功能:根据音频链接(links)和时间线(timelines),生成适合剪映的人声音频信息(infos),用于后续视频合成。

图片
8. BGM搜索
- 名称:BGM搜索节点(search_bgm)
- 功能:根据“轻松活泼”关键词搜索背景音乐库,输出包含背景音乐URL、标题、时长等信息的结果列表(data)。

图片
9. 提取BGM为列表格式(代码)
- 名称:代码节点(提取BGM为列表格式)
- 功能:处理BGM搜索结果(bgmData),提取第一个背景音乐的URL,生成BGM列表(bgm)。

图片
10. 背景音乐audio_infos(剪映数据生成)
- 名称:背景音乐数据生成节点(audio_infos)
- 功能:根据BGM链接(bgm)和总时间线(all_timelines),生成适合剪映的背景音乐信息(infos),用于后续视频合成。

图片
三、核心工作流节点关系

图片
- 步骤 1: 查询数据节点,从指定数据库中查询与用户输入基础单词(en_word)匹配的历史匹配单词,输出包含匹配单词的列表(outputList),关联关系: 为步骤 2提供历史匹配列表(outputList)
- 步骤 2: 大模型节点,调用DeepSeek - R1大语言模型,结合用户输入的基础单词(en_word)和历史匹配列表(outputList),生成符合规范的7个匹配单词,输出结构化JSON格式的单词列表(words),关联关系: 接收步骤 1 的历史匹配列表(outputList),为步骤 3 提供单词列表(words)
- 步骤 3: 代码节点(文案口播数据格式化),处理大模型输出的单词列表(words),提取每个单词的"word"和"meaning"字段,生成格式化的word_list和first_word,关联关系: 接收步骤 2 的单词列表(words),为步骤 4 提供word_list
- 步骤 4: 语音合成节点,调用语音合成插件(speech_synthesis),将word_list作为文本输入,生成音频文件,输出包含音频链接等信息的结果列表(outputList),关联关系: 接收步骤 3 的word_list,为步骤 5 提供结果列表(outputList)
- 步骤 5: 提取语音URL节点(audio_link_collector),从语音合成结果(outputList)中提取音频链接字段(data.link),输出音频链接数组(links),关联关系: 接收步骤 4 的结果列表(outputList),为步骤 6 和步骤 7 提供音频链接数组(links)
- 步骤 6: 提取音频时间线节点(audio_timelines),分析音频链接(links)的音频内容,生成每个音频段的时间线及总时间线(all_timelines),关联关系: 接收步骤 5 的音频链接数组(links),为步骤 7 提供总时间线(all_timelines)
- 步骤 7: 文案人声数据生成节点(audio_infos),根据音频链接(links)和时间线(timelines),生成适合剪映的人声音频信息(infos),关联关系: 接收步骤 5 的音频链接数组(links)和步骤 6 的总时间线(all_timelines)
- 步骤 8: BGM搜索节点(search_bgm),根据“轻松活泼”关键词搜索背景音乐库,输出包含背景音乐URL、标题、时长等信息的结果列表(data),关联关系: 为步骤 9 提供结果列表(data)
- 步骤 9: 代码节点(提取BGM为列表格式),处理BGM搜索结果(bgmData),提取第一个背景音乐的URL,生成BGM列表(bgm),关联关系: 接收步骤 8 的结果列表(data),为步骤 10 提供BGM列表(bgm)
- 步骤 10: 背景音乐数据生成节点(audio_infos),根据BGM链接(bgm)和总时间线(all_timelines),生成适合剪映的背景音乐信息(infos),关联关系: 接收步骤 6 的总时间线(all_timelines)和步骤 9 的BGM列表(bgm)
-
AI大模型学习福利
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获四、AI大模型商业化落地方案

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量.

被折叠的 条评论
为什么被折叠?



