Gemini 2.0 Flash原生图像生成上线,用嘴改图的时代来了!

这两天,看到社群里持续分享各种Google Gemini画图的玩法,确实为他们的脑洞感到震惊,原来画图可以有这么多玩法!昨天晚上自己也去体验了一把,确实惊艳,这对于我这种不会P图的人来说,简直是福音,怕是有一大波设计师又要焦虑了!

先给大家看看效果:

话不多说,先直接给大家上链接:

https://aistudio.google.com/

打开后会看到这个界面(需要魔法):

通过简单的设置即可体验用嘴画图:

先选择模型Gemini 2.0 Flash Experimental

再选择输出格式,必须选择Images and text,这样才能输出图片:

设置好之后就可以愉快地体验画图、修图了。

给大家分享一些有趣的玩法。

1.一句话生成个人专属头像

2.懂人话的画师打工人

3.画本高效创造器

可以看到,Gemini不仅保持了故事的连续性,还保证了角色的一致性,确实很强。

4.超级缝合怪

5.专业设计师

效果还是震撼,真的实现了动动嘴就能画出你想要的图。

相比于传统的AI画图工具,Gemini 2.0 Flash在图片生成、交互式编辑、世界知识、文本渲染等方面都有了很大的进步:

除了通过Google AI Studio进行交互式的体验,还可以是要API在自己的项目中进行调用,一个基于Python的简单示例如下:

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import os
from datetime import datetime
import base64

client = genai.Client(api_key='xxx')

contents = ('画一头可爱的小乌龟,使用3D数字艺术风格。对于每个场景,生成一张图片。')

response = client.models.generate_content(
    model="models/gemini-2.0-flash-exp",
    contents=contents,
    config=genai.types.GenerateContentConfig(response_modalities=['Text', 'Image'])
)

通过这样的方式,就可以将Gemini的图像生成编辑功能嵌入到各种应用中,快来发挥你的脑洞吧!

曾经,我也会为图像编辑而头痛,想着要不要去学一下PhotoShop,现在一句话就能实现我们的所有创意,就算对于从来没有用过PS 的小报,也能轻松地动嘴就能将脑海中的想法与创意转变为跃然纸上的一幅幅精美图片。

这,或许就是,AI时代,能给予我们最美好的礼物之一。

### 关于Gemini 2.0 Flash的技术文档下载、安装与使用教程 #### 文档获取途径 对于希望深入了解Gemini 2.0 Flash技术细节并获取官方指导文件的开发者而言,通常可以通过访问Google AI官方网站或GitHub仓库来找到最新的API文档和技术白皮书。此外,在一些情况下,特定版本如Flash可能通过参与早期测试计划获得专属资料[^1]。 #### 安装环境准备 为了顺利部署和运行Gemini 2.0 Flash模型,建议先确认本地开发环境中已正确配置Python解释器及相关依赖库。考虑到该模型对硬件性能有一定要求,拥有NVIDIA GPU支持将会显著提升训练效率。同时,确保网络连接稳定以便顺利完成必要的软件包更新操作[^4]。 #### 使用指南概览 一旦完成上述准备工作,则可通过如下方式快速启动Gemini 2.0 Flash的应用程序: -m venv gemini_env source ./gemini_env/bin/activate # Linux/MacOS 或者 .\gemini_env\Scripts\activate.bat # Windows ``` - **安装所需库**:依据官方提供的requirements.txt清单批量安装第三方模块 ```bash pip install -r requirements.txt ``` - **加载预训练模型**:利用`transformers`或其他兼容接口读取远程服务器上的权重参数 ```python from transformers import AutoModelForCausalLM, AutoTokenizer model_name_or_path = "google/gemini-2.0-flash" tokenizer = AutoTokenizer.from_pretrained(model_name_or_path) model = AutoModelForCausalLM.from_pretrained(model_name_or_path) ``` - **构建交互界面**:借助Streamlit等可视化工具搭建简易的人机对话平台,方便用户输入查询语句并展示返回结果 ```python import streamlit as st user_input = st.text_area("请输入您的问题:") if st.button('提交'): inputs = tokenizer(user_input, return_tensors="pt") outputs = model.generate(**inputs) response_text = tokenizer.decode(outputs[0], skip_special_tokens=True) st.write(response_text) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

东哥说AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值