Veo 2视频生成模型登陆Gemini平台

视频生成功能现已上线

其最新的视频生成模型Veo 2已正式向Gemini Advanced用户开放[citation:1]。订阅用户现在可以在Gemini的网络端和移动应用的下拉模型菜单中选择Veo 2,通过输入文本提示词,生成一段时长为8秒、分辨率为720p的视频片段[citation:1][citation:8]。生成的视频以MP4格式提供,并采用16:9的横屏比例[citation:4]。

这项功能作为Google One AI高级版订阅权益的一部分,正逐步向全球用户推出[citation:4]。用户每月可生成的视频数量存在限制,系统会在用户接近额度时发出通知[citation:1]。

Veo 2模型的技术特性

Veo 2模型在理解真实世界物理规律和人体运动方面进行了显著升级,旨在生成具有电影般真实感的视频[citation:1]。其核心目标是呈现流畅的角色动作、逼真的场景以及跨越不同主题和风格的精细视觉细节[citation:8]。

为了确保生成内容的安全性和可追溯性,所有由Veo 2创建的视频都会嵌入SynthID数字水印,以标识其为AI生成内容[citation:1][citation:8]。

配套工具与创作流程

除了在Gemini中直接生成视频,Veo 2的能力也被整合到了其他创意工具中:

  • Whisk Animate动画工具:通过某机构的实验室平台,Google One AI Premium订阅用户可以使用Whisk Animate工具。该工具允许用户将一张静态图片转换为一段8秒的动画视频,扩展了Veo 2的应用场景[citation:1][citation:8]。
  • 提示词与分享:用户可以通过详细的文本描述来指导视频生成,描述越具体,对最终视频内容的把控力越强[citation:4]。在移动设备上,用户可以轻松地使用分享按钮,将生成的短视频直接发布到TikTok或YouTube等平台[citation:1][citation:4]。

模型的发展背景

Veo 2模型并非首次亮相。此前,它已通过某中心的Vertex AI平台以早期访问的形式提供,当时按每秒视频0.50美元的标准收费[citation:1]。此次整合至Gemini应用,标志着该技术从面向开发者和企业的API服务,扩展至更广泛的消费级产品中[citation:10]。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

### 谷歌 Veo 2 图像生成视频的 API 使用示例 Google 的 Veo 2 是一个文本到视频生成模型,同时也支持基于图像生成视频的功能。虽然目前官方并未提供完整的开放 API 文档,但可以通过 Google Cloud 的 Vertex AI 平台调用类似模型的预训练服务。以下是一个模拟的 API 使用示例,展示如何通过图像生成视频。 #### 示例代码 ```python import vertexai from vertexai.generative_models import GenerativeModel, Part # 初始化 Vertex AI 客户端 vertexai.init(project="your-gcp-project", location="us-central1") # 加载 Veo 2 模型 model = GenerativeModel("veo2") # 读取输入图像 input_image = Part.from_uri("gs://your-bucket/input_image.jpg", mime_type="image/jpeg") # 构建提示词 prompt = "Generate a 10-second video based on the input image, showing a smooth animation of the scene." # 调用模型生成视频 response = model.generate_content( [input_image, prompt], generation_config={ "max_output_tokens": 8192, "temperature": 0.7, "top_p": 0.95, "top_k": 40 } ) # 输出生成的视频链接 print(f"生成的视频链接: {response.text}") ``` 在上述代码中,`vertexai` 是 Google 提供的 SDK,用于与 Vertex AI 平台交互。`GenerativeModel` 是用于加载和调用模型的类,`Part.from_uri` 方法用于从 Google Cloud Storage 加载图像资源。生成的视频结果通常会返回一个存储在云端的链接,供用户下载或嵌入到应用中。 #### 生成视频的关键参数 - **max_output_tokens**:控制输出内容的最大长度,适用于生成较长的视频描述或脚本。 - **temperature**:控制生成内容的随机性,值越高生成结果越多样化。 - **top_p** 和 **top_k**:用于控制生成过程中的采样策略,影响视频内容的连贯性和质量。 #### 注意项 - 需要提前在 Google Cloud 上创建项目,并启用 Vertex AI API。 - 图像文件需要上传到 Google Cloud Storage,并确保访问权限正确。 - 生成视频的时间和成本取决于模型的复杂度和输入数据的大小。 #### 参考资料 - Google 提供的 Vertex AI SDK 支持多种语言,包括 Python、Node.js 等,开发者可以根据需求选择合适的语言进行集成[^1]。 - 生成视频的质量和内容一致性可以通过调整提示词和生成参数进行优化[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值