谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!

    Gemma 3 被谷歌称为目前最强的开源视觉模型之一。 该模型支持超过35种语言,能够分析文本、图像和短视频。值得注意的是,Gemma 3 的视觉编码器经过升级,支持高分辨率和非方形图像,并引入了 ShieldGemma 2 图像安全分类器,用于过滤被分类为性暗示、危险或暴力的内容。这些特性使得 Gemma 3 成为当前最强大的开源视觉模型之一。

图片[1]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

此图表按 Chatbot Arena Elo 得分对 AI 模型进行排名;得分越高(数字越大),表示用户偏好越高。点表示估计的 NVIDIA H100 GPU 要求。Gemma 3 27B 排名靠前,只需要一个 GPU,而其他模型则需要多达 32 个。

本地安装,单显卡可以选择1b,4b,12b,27b,推荐选择27b,因为Gemma 3 27B 处于帕累托最佳点

图片[2]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

对于 1B 版本,输入上下文窗口长度已从 Gemma 2 的 8k 增加到32k ,对于其他所有版本,则增加到 128k。与其他 VLM(视觉语言模型)一样,Gemma 3 会根据用户输入生成文本,这些文本可能由文本组成,也可能由图像组成。示例用途包括问答、分析图像内容、总结文档等。

本地部署Gemma 3开源大模型:

1、下载官方 Ollama 【点击前往】 ,并通过下方的安装命令执行下载:

普通用户建议选择4b和12b,显卡好的可以上27b 

ollama run gemma3:1b
ollama run gemma3:4b
ollama run gemma3:12b
ollama run gemma3:27b

2、通过Chrome插件调用本地Gemma 3视觉大模型【点击下载

图片[3]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

就可以愉快的使用了

图片[4]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

可以很好的对图片进行识别:

图片[5]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

当然你可以使用Google AI Studio 对短视频进行分析,支持上传和链接

Google AI Studio :【点击前往

afbbc931f520250315153635

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值