人工智能_大模型070_多模态大语言模型18_AnimateDiff图生视频_AnimateAnyone姿势生视频_原生视频模型Sora_NaVIT_MagVIT---人工智能工作笔记0205

本文介绍了文生视频的两种生成路径,包括基于文生图生成视频和直接用模型生成视频,重点讨论了原生视频模型Sora。Sora利用AnimateDiff和MagViT技术,能在空间和时间上进行学习,生成高质量的视频。同时提到了其他模型如AnimateAnyone,它基于人的pose姿势生成视频,以及Temporal Transformer和VideoPoet在视频生成领域的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

对于文生视频来说,有两个路径一种是,基于文生图,生成视频的,每个帧,然后再来生成视频

然后还有一种是,直接用模型生成视频,这种是视频模型.

代表就是sora.

他的原理就是:

AnimateDiff,首先用lora,把低质量的数据集中的数据特征进行学习,主要是把低质量的内容剔除掉,利用低质量的特征,然后再用

temporal transformer 进行学习,这个架构可以在,空间以及时间上进行学习,也就是,不光是对静态图片,对动态视频也可以良好的

学习内容,然后

然后这个是animateDiff的生成效果,当然是视频,只不过视频不好放,这里放图片了.

animateDiff文生视频,就是利用文生图片,生成视频的很多帧,然后再组合成一个视频.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值