目录
引言
想象一下,只需用文字描述你脑海中的画面,AI 就能瞬间将其转化为逼真或充满创意的图像。这不再是科幻小说,而是质谱 AI 的 CogView 模型带来的强大能力!无论是精准还原细节,还是打造个性化艺术风格,CogView 都能通过对文本的深刻理解,实现高效、精准的图像生成。现在,通过质谱 AI 开放平台提供的文生图 API,开发者可以轻松地将这一视觉创造力集成到自己的应用或服务中。本文将带您快速上手 CogView 文生图 API,详细介绍其调用方式、核心参数以及实际应用示例,助您开启 AI 图像生成之旅。
质谱API的文生图API
质谱AI的CogView模型适用于图像生成任务,通过对用户文字描述快速、精准的理解,让AI的图像表达更加精确和个性化,其API接口参见智谱AI开放平台。
接口请求
传输方式 | HTTPS |
---|---|
请求地址 | https://open.bigmodel.cn/api/paas/v4/images/generations |
调用方式 | 同步调用,等待模型执行完成并返回最终结果 |
字符编码 | UTF-8 |
接口请求格式 | JSON |
响应格式 | JSON |
接口请求类型 | POST |
开发语言 | 任意可发起 http 请求的开发语言 |
请求参数
参数名 | 类型 | 必填 | 描述 |
---|---|---|---|
model | String | 是 | 模型编码,目前支持:cogview-4-250304、cogview-4、cogview-3-flash |
prompt | String | 是 | 所需图像的文本描述 |
quality | String | 否 | 生成图像的质量,默认为 standard hd : 生成更精细、细节更丰富的图像,整体一致性更高,耗时约20 秒 standard :快速生成图像,适合对生成速度有较高要求的场景,耗时约 5-10 秒 此参数仅支持 cogview-4-250304 。 |
size | String | 否 | 图片尺寸,推荐枚举值:1024x1024,768x1344,864x1152,1344x768,1152x864,1440x720,720x1440,默认是1024x1024。 自定义参数:长宽均需满足 512px - 2048px 之间,需被16整除, 并保证最大像素数不超过 2^21 px。 |
user_id | String | 否 | 终端用户的唯一ID,协助平台对终端用户的违规行为、生成违法及不良信息或其他滥用行为进行干预。ID长度要求:最少6个字符,最多128个字符。 |
响应参数
参数名称 | 类型 | 参数说明 |
---|---|---|
created | String | 请求创建时间,是以秒为单位的Unix时间戳。 |
data | List | 数组,包含生成的图片 URL。目前数组中只包含一张图片。 |
url | String | 图片链接。图片的临时链接有效期为 30天,请及时转存图片。 |
content_filter | List | 返回内容安全的相关信息。 |
role | String | 安全生效环节,包括 role = assistant 模型推理,role = user 用户输入,role = history 历史上下文 |
level | Integer | 严重程度 level 0-3,level 0表示最严重,3表示轻微 |
测试
首先在质谱AI平台上注册账号,并获得API KEY,然后使用免费的cogview-3-flash接口生成一幅图片试试。
curl -X POST "https://open.bigmodel.cn/api/paas/v4/images/generations" \
-H "Authorization: Bearer XXX" \
-H "Content-Type: application/json" \
-d '{
"model": "cogview-3-flash",
"prompt": "国画风格,李白月下弹吉他",
"size": "1024x1024"
}'
返回的结果是
{"created":1749967623,"data":[{"url":"https://aigc-files.bigmodel.cn/api/cogview/202506151407037195a88b79874d78_0.png"}]}
图片效果如下:
结束语
通过本文的介绍,我们了解了质谱 AI CogView 文生图 API 的强大功能和便捷接入方式。从清晰简洁的接口请求规范,到灵活多样的参数设置(如模型选择、图像质量、尺寸定制),再到直观的响应格式,该 API 为开发者提供了高效调用 AI 图像生成能力的途径。我们通过“国画风格,李白月下弹吉他”这样充满创意的提示词进行了实际测试,快速获得了生成结果(图片效果见下方)。这充分展示了 CogView 模型在理解和执行复杂、个性化图像描述方面的实力。