Meta 的 Emu Edit 和 Emu Video 首次亮相

Meta 近期发布了两项令人惊叹的媒体合成技术进展,包括文本转图像和文本转视频。这两项研究都基于 Meta 两个月前发布的文本转图像模型 EMew,该模型在图像生成质量方面表现出色,Meta 声称它在 70% 的情况下优于 SDXL 模型。

EMew Edit 是一个专注于指令编辑的文本转图像模型,它能够精确地遵循编辑指令,同时确保图像中与指令无关的部分不受影响。EMew Edit 的强大功能使其能够进行少样本图像遮罩或生成超分辨率图像,类似于 Controna 的 Tallying。EMew Edit 在训练过程中使用了大量不同类型的数据,这解释了它为什么能够如此干净地完成各种任务,例如分割、Mantic 映射甚至手部检测。

EMew 视频模型能够生成高质量的视频,视频中的纹理一致、主体背景分离清晰,并且视频质量明显高于其他同分辨率的 AI 视频生成器。尽管 EMew 视频目前仅限于 4 秒和 16 FPS,但延长视频长度并非难事。该模型基于扩散模型,首先生成初始图像,然后根据提示和初始图像生成视频的其余帧。

与其他文本转视频模型相比,EMew 视频在质量和真实性方面表现出色,远远领先于其他模型。唯一接近 EMew 视频性能的模型是 Imogen 的视频模型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

bycloudAI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值