Nano Banana Pro 玩法测试

谷歌的Nano Banana Pro 就这样没有任何预热的发布了,上一代的强大能力几乎秒杀当时同类模型,现在pro版已更新,我们来将它的玩法都测试一下。当然,我们直接用官方渠道有点难,又有免费限额,还被地区IP限制,所以我们采用的是中转平台的API接口测试方式

Nano Banana Pro,对应的模型名称是:gemini-3-pro-image-preview,是一个具有思考+联网能力的多模态绘画模型,是的,没有看错,这一代的banana具有思考能力,也有联网能力(google ai studio上有联网,api暂时没有),相对之前的绘画模型有了质的飞越,对多个国家文字的支持也更好了。

⚙️接口配置

为方便不会代码的朋友,我们分用两种模式来配置接口使用。

Cherry Studio配置方式

这种配置相对比较简单,适合没有代码基础的大众人群,相互界面也比较友好,除了有些小BUG让人无语,其他都还是比较方便大家使用的。

  1. cherry studio官网下载好客户端,在电脑上安装好

  2. 第二步还是登录我们的中转站 KL大模型API中转平台 进行账号注册,同时生成对应的令牌。注意,令牌一定要选择Gemini相关分组的,比如优质gemini和官转gemini,建议使用优质gemini分组,毕竟另一个分组扣费可是3倍啊!

3. 在 KL大模型API中转平台 的左侧菜单里,点击图片上的菜单栏,选择要使用的gmini令牌,然后会自动唤起cherry studio进行渠道配置。

4. 在cherry studio中配置对应模型(gemini-2.5-flash-image-preview是第一代banana,gemini-3-pro-image-preview是最新的banana pro)

接口调用模式

这个相对技术人员就比较简单了,用postman、apifox等都可以快速的用起来

  1. 同样的还是去我们的中转站 KL大模型API中转平台 进行账号注册,同时生成对应的令牌。注意,令牌一定要选择Gemini相关分组的,比如优质gemini和官转gemini,建议使用优质gemini分组,原因就是便宜。

2. 配置api调用参数(开发人员都懂怎么用吧?),因为gemini-3-pro-image-preview是支持openAI接口兼容格式的,所以我们完全可以按openAI的方式调用接口

 
curl --request POST \
  --url https://api.kl-api.info/v1/chat/completions \
  --header 'Authorization: Bearer sk-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX' \
  --header 'content-type: application/json' \
  --data '{
  "model": "gemini-3-pro-image-preview",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "生成北京地标实景图"
        }
      ]
    }
  ]
}'
curl --request POST \
  --url https://api.kl-api.info/v1/chat/completions \
  --header 'Authorization: Bearer sk-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX' \
  --header 'content-type: application/json' \
  --data '{
  "model": "gemini-3-pro-image-preview",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "将图片中的文字改为英文"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://cbu01.alicdn.com/img/ibank/O1CN019e7B9u1PKWbn4Lwto_!!2212484151822-0-cib.jpg"
          }
        }
      ]
    }
  ]
}'

如果是多图的合成时,content里的image_url的内容可以提交多个

3. 返回参数示例:

{
  "id": "chatcmpl-20251123212305717539932lnJHh0CF",
  "model": "gemini-3-pro-image-preview",
  "object": "chat.completion",
  "created": 1763904203,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "![image](data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEBLAEsAAD................)"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 12,
    "completion_tokens": 1455,
    "total_tokens": 1467,
    "prompt_tokens_details": {
      "cached_tokens": 0,
      "text_tokens": 12,
      "audio_tokens": 0,
      "image_tokens": 0
    },
    "completion_tokens_details": {
      "text_tokens": 0,
      "audio_tokens": 0,
      "reasoning_tokens": 171
    },
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": null
  }
}

在返回的content里,得到的是"![image](data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEBLAEsAAD................)"格式的字符串,看小括号里的内容,是不是明白了?nano banana返回的是base64编码后的图片,可以用相应的在线工具再转成图片,查看生成结果

🎮玩法测试

自定义卡通漫画

生成一张小学生看的四格成语漫画,漫画讲的是“刻舟求剑”成语的故事。

做数学题

画一张草稿纸,上面是用圆珠笔手写这道题的解题过程和答案

画简笔画

Q版多啦A梦简笔画教程,分步图解,第一步画大大的圆形脑袋,逐步添加身体和四肢,最后上色,可爱风格,线条流畅,马克笔质感

生成电商页面图

为这个娃娃创建一个网店页面,风格类似于亚马逊

插画设计

四季主题16:9插画:画面垂直分为四个部分,每个部分运用冷暖渐变色和极简的光影来描绘春、夏、秋、冬。每个部分的中心只画有一棵树,其枝叶与能体现季节变化的背景细节(雪地、花朵、绿坡、金色麦田)相呼应。整体采用柔和的粉蜡色调、扁平质感和颗粒图案,使不同季节既独立又和谐。

翻译+上色

翻译成中文并上色

复刻UI

生成一张MacOS桌面截图,桌面上已打开Google Chrome浏览器。在浏览器窗口中,展示YouTube网站,并显示IShowSpeed 频道的视频缩略图。

根据地图箭头生成地面视角图片

从红色圆圈沿箭头方向画出真实世界的视角

制作等距模型

将图像的建筑制作成白天的等距视图3D模型

平面转3D图

根据这张平面设计图生成对应的3D设计图

修复老照片

给这张老照片修复高清并上色

生成微信聊天界面

生成微信群聊消息截图,里面是马化腾和各AI公司的CEO正在谈合作,我希望聊天对话非常清晰

商品损坏模拟

让这双鞋的鞋尖开胶严重,能明显看到张开状态

这个很危险!!!大家不要乱学,电商商家也要注意!!!

预测事物变化

展示这个人头发褪色的过程,分别是30天,3个月,1年

🎇更多玩法

开源案例集:Awesome-Nano-Banana-images

<think> 嗯,用户这次问的是Nano Banana Pro和非Pro版本在API上的具体区别。看来用户是个开发者,正在评估不同版本的功能和成本,可能准备接入API做开发。 从用户之前的提问看,ta已经了解webappId的基础概念,现在更关注实际开发时的功能差异。用户两次提问都提到API,说明技术评估需求明确,可能需要为项目选型。 需要特别注意几个技术维度:功能接口差异、性能参数、成本结构。用户引用中提到的"速创API"价格是0.1元/次,这可能是非Pro版的市场价,Pro版成本必然更高但能力更强。 比较棘手的是引用[3]的淘宝链接失效了,不能作为参考。主要依据应该是官方文档的技术参数,结合行业通用实现逻辑来对比。图像生成类API的差异通常体现在三个层面:算法模型版本、输出质量参数、并发处理能力。 用户没有说明具体应用场景,但提到"手办化"的引用,可能涉及图像生成。需要强调Pro版在复杂构图和细节还原上的优势,比如材质光影处理——这对商品展示类应用很关键。 安全方面要提醒API密钥的权限隔离,Pro版密钥应该具备更高风险操作权限。成本部分需明确Pro版虽然单次调用贵,但可能通过批量优惠降低边际成本。 </think>以下是Nano Banana Pro与非Pro版本在API层面的核心区别对比,基于技术文档和行业实践整理: --- ### **1. 模型能力差异** | **特性** | **Pro版** | **非Pro版** | |----------------------|--------------------------------------|-----------------------------------| | **模型架构** | Gemini Ultra 1.5(多模态增强) | Gemini Pro 1.0(基础多模态)[^2] | | **上下文长度** | $$ 128K \ tokens $$ | $$ 32K \ tokens $$ | | **图像生成分辨率** | 4096×4096(8K超清) | 2048×2048(4K标准) | | **细节控制参数** | 支持`style_preset`(材质/光照) | 仅基础参数(尺寸/数量)[^1] | --- ### **2. API功能接口差异** **Pro版独占接口**: ```python # 多轮视觉推理 (Vision Reasoning Chain) POST /v1/pro/multistep_vision { "steps": [ {"analyze_scene": {...}}, {"generate_3d_model": {...}} # 支持3D模型生成 ] } # 商业级图像编辑 POST /v1/pro/image_edit { "mask_precision": 0.98, # 像素级遮罩 "material_replace": true # 材质替换功能 } ``` **非Pro版限制**: - 最大并发请求:`5 req/s`(Pro版为`50 req/s`) - 缺失`/image_edit`和`/multistep_vision`端点[^2] --- ### **3. 性能与配额** | **指标** | **Pro版** | **非Pro版** | |------------------|------------------------------|----------------------------| | **TP99延迟** | $$ \leq 800 \ ms $$ | $$ \leq 2 \ s $$ | | **每日免费配额** | 1000次(高清生成) | 200次(标清生成)[^1] | | **计费单价** | $0.15/次(复杂任务) | $0.03/次(基础任务)[^1] | --- ### **4. 安全与管控** - **Pro版**强制要求[动态密钥签名](https://cloud.google.com/docs/authentication): ```bash curl -H "X-Signature: sha256(secret_key+timestamp)" ``` - **非Pro版**仅需基础`webappId`验证 > ⚠️ 重要提示:Pro版API响应包含**版权元数据**(如`copyright_owner`字段),商用需授权[^2] --- ### **典型场景选择建议** - **选非Pro版**:简单图像生成、文案优化、基础问答 - **选Pro版**: - 工业设计(3D模型生成) - 影视级特效渲染 - 医疗影像分析(需合规配置)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值