Gemini新增AI图像检测功能,但识别能力有限

Google今天宣布在Gemini应用和网站中正式发布SynthID检测器功能,用户可以上传任何图像并询问机器人该图片是否由AI创建或修改。不过这项新功能存在相当大的局限性。

由于新功能使用的是SynthID技术,其检测范围极其有限——它只能识别由Gemini创建并标记有Google制作的SynthID水印的图像。SynthID于2023年开发,几年来一直是Google各种图像生成AI模型的组成部分。据Google称,该水印系统设计为人眼无法察觉,即使图像被裁剪或修改也仍可检测到。

虽然SynthID是开源的,Google也与Hugging Face和Nvidia等知名合作伙伴达成合作,但除了这些例子外,Gemini的SynthID检测器实际上无法确定性地判断图像是否由AI创建。

在我们对ChatGPT生成的AI图像进行测试时,Gemini无法可靠地判断图片是否由AI生成,但它确实根据暴露AI生成内容的小细节进行了几次正确的推理。另一方面,使用Gemini创建的图像都被标记为包含SynthID水印。

与Google依赖水印不同,ChatGPT依靠内容来源和真实性联盟(C2PA)开发的元数据系统来标记其内容为AI生成。除了OpenAI,C2PA还被微软、Adobe、Meta等公司使用。

Google发言人告诉The Register,公司计划未来在Gemini中添加对C2PA的支持,"这样您就能够检查由Google生态系统之外的模型和产品创建的内容的原始来源。"

即使有了C2PA支持,专家们警告说,基于水印和元数据检测AI图像并不是确保来源可靠性的最佳方法。正如我们在6月报道的那样,加拿大滑铁卢大学的计算机科学家开发了一种名为"UnMarker"的方法,他们声称可以在几分钟内使用40 GB的Nvidia A100 GPU移除AI图像水印(包括SynthID),且无需互联网连接。

Google Deepmind研究人员此前也得出了相同结论,该论文甚至质疑了C2PA元数据,指出它的稳健性甚至不如水印技术。

换句话说,就像任何现代AI产品一样,不要相信SynthID检测器能可靠地区分事实和虚构——它和普通大语言模型一样容易被错误输入数据欺骗。

Nano Banana Pro现已发布

除了在Gemini中公开发布AI检测功能外,Google今天还发布了Nano Banana Pro,这是其Nano Banana图像生成引擎的升级版本,基于最近发布的Gemini 3 Pro模型构建,距离发布我们印象深刻的初始版本仅几个月时间。

据该公司称,最新模型专门设计用于生成更清晰的文本,还可用于生成包含实际可读内容的信息图表,而不是以往AI图像生成工具典型的类似语言的胡言乱语。

我们使用Nano Banana Pro创建了上述递归主题图像,以及下面包含的令人耳目一新的Reg品牌汽水瓶。与ChatGPT相比,Nano Banana Pro创建图像的速度极快,无需重新提示进行文本更正。

像所有Google的AI生成图像一样,在Nano Banana Pro中创建的图像包括可见的Gemini闪光水印以及SynthID内容。

出于好奇,我们将Nano Banana Pro创建的The Register汽水图像通过旨在剥离SynthID水印的工具进行处理,但Gemini仍然检测到图像中存在SynthID。即便如此,Gemini告诉我们,它可能仍会根据我们的声誉判断这不是真实的。

"[The Register]经常在其文章标题中使用幽默或定制图形,"Gemini解释道。"这张图像很可能是为他们的某个故事生成的库存照片或插图。"

好吧,这次被Gemini识破了。

Q&A

Q1:SynthID检测器能检测出所有AI生成的图像吗?

A:不能。SynthID检测器存在相当大的局限性,它只能识别由Gemini创建并标记有Google制作的SynthID水印的图像。对于其他AI工具生成的图像,如ChatGPT创建的图像,无法可靠地进行检测。

Q2:Nano Banana Pro相比之前版本有什么改进?

A:Nano Banana Pro是基于最近发布的Gemini 3 Pro模型构建的升级版本,专门设计用于生成更清晰的文本,还可用于生成包含实际可读内容的信息图表,创建图像的速度也比ChatGPT更快,无需重新提示进行文本更正。

Q3:AI图像水印技术可靠吗?

A:专家警告基于水印和元数据检测AI图像并不是最可靠的方法。加拿大滑铁卢大学研究人员开发的"UnMarker"方法可以在几分钟内移除包括SynthID在内的AI图像水印,Google Deepmind研究人员也得出相同结论。


人工智能AI图像检测技术是一种基于深度学习和计算机视觉的方法,用于自动识别、分析和理解图像中的特定对象或模式。这种技术在多个行业中得到了广泛应用,例如医疗、制造、交通和安防等。图像检测通常涉及目标检测图像分类、特征提取等任务,其核心是通过训练深度学习模型来识别图像中的特定特征或对象。 AI图像检测技术通常依赖于卷积神经网络(CNN)等深度学习模型。这些模型通过大量标注的数据进行训练,以识别图像中的特定模式。例如,在医学影像分析中,AI可以用于检测X射线、CT扫描和MRI图像中的病变或异常情况,从而帮助医生进行更准确的诊断[^3]。在制造业中,AI图像检测可以用于产品质量控制,通过自动化检测生产线上的产品缺陷,提高检测效率和准确性[^4]。 在实际应用中,AI图像检测技术通常需要考虑以下几个关键因素: 1. **数据质量与数量**:高质量的训练数据是确保模型性能的基础。数据集需要包含足够多的样本,并且样本需要准确标注。 2. **模型选择与优化**:根据具体应用场景选择合适的模型架构,并进行优化以提高检测精度和速度。 3. **实时性要求**:在某些应用场景中,例如自动驾驶或实时监控,系统需要具备实时检测能力。 4. **缺陷分类与反馈机制**:系统需要能够区分不同类型的缺陷,并提供清晰的反馈,以便用户能够及时采取行动。 5. **集成与部署**:考虑是否可以利用现有软件集成视觉检测功能,或者是否需要从头开始开发新的系统。 以下是一个简单的AI图像检测示例代码,使用Python和OpenCV库进行目标检测: ```python import cv2 # 加载预训练的深度学习模型 net = cv2.dnn.readNetFromTensorflow('frozen_inference_graph.pb', 'ssd_mobilenet_v2_coco_2018_03_29.pbtxt') # 读取图像 image = cv2.imread('test_image.jpg') height, width, _ = image.shape # 预处理图像 blob = cv2.dnn.blobFromImage(image, size=(300, 300), swapRB=True, crop=False) # 输入图像到模型 net.setInput(blob) # 获取检测结果 detections = net.forward() # 解析检测结果 for i in range(detections.shape[2]): confidence = detections[0, 0, i, 2] if confidence > 0.5: # 置信度阈值 class_id = int(detections[0, 0, i, 1]) x_left_bottom = int(detections[0, 0, i, 3] * width) y_left_bottom = int(detections[0, 0, i, 4] * height) x_right_top = int(detections[0, 0, i, 5] * width) y_right_top = int(detections[0, 0, i, 6] * height) # 绘制检测框 cv2.rectangle(image, (x_left_bottom, y_left_bottom), (x_right_top, y_right_top), (0, 255, 0), 2) # 显示检测结果 cv2.imshow('Image Detection', image) cv2.waitKey(0) cv2.destroyAllWindows() ``` 该代码使用了预训练的SSD MobileNet模型对图像中的对象进行检测,并绘制检测框以标记检测到的对象。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值