多模态大模型 deepseek-ai/Janus-Pro-1B

【多模态大模型】 多模态大模型 deepseek-ai/Janus-Pro-1B

Janus-Pro-1B 模型介绍

Janus-Pro是一种新颖的自回归框架,它统一了多模态的理解和生成。该框架通过将视觉编码分解为独立的路径,解决了以往方法的局限性,同时仍然使用单一的统一Transformer架构进行处理。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突,还增强了框架的灵活性。Janus-Pro超越了以往的统一模型,并在性能上与特定任务的模型相当甚至超过它们。Janus-Pro的简洁性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选。

  • github:

    Github: https://github.com/deepseek-ai/Janus

  • 性能

    在这里插入图片描述

  • 生成效果示例

    在这里插入图片描述

  • Model Summary

    Janus-Pro是基于DeepSeek-LLM-1.5b-base构建的。
    在多模态理解方面,它使用SigLIP-L作为视觉编码器,支持384×384像素的图像输入。在图像生成方面,Janus-Pro使用了这里的标记器,下采样率为16。

  • 发布时间

    2025年1月28日

下载

model_id: deepseek-ai/Janus-Pro-1B
下载地址:[https://hf-mirror.com/deepseek-ai/Janus-Pro-1B](https://hf-mirror.com/deepseek-ai/Janus-Pro-1B)   不需要翻墙

运行环境安装

git clone https://github.com/deepseek-ai/Janus
cd Janus
pip install -e .  -i https://pypi.mirrors.ustc.edu.cn/simple

模型推理示例

  • Multimodal Understanding

    
    import torch
    from transformers import AutoModelForCausalLM
    from janus.models import Mult
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

szZack

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值