MiniGPT-4来了、脱胎于LLama、开源且好用

MiniGPT-4通过结合Vicuna语言模型和BLIP-2的视觉组件增强视觉语言理解。模型经过3,500个对齐图像文本对的微调,提高了生成语言的自然性,但中文支持仍有待加强。
部署运行你感兴趣的模型镜像

网址:https://minigpt-4.github.io/

论文:MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models

代码:https://github.com/Vision-CAIR/MiniGPT-4

演示:MiniGPT-4 - a Hugging Face Space by Vision-CAIR

模型:Vision-CAIR/MiniGPT-4 · Hugging Face

主要思路如图所示:

大致做法为:

1,在语言特征方面:使用大型语言模型 (LLM)--Vicuna(其中 Vicuna 是基于 LLaMA 构建的)进行调优。

2,在视觉感知方面:作者采用了与BLIP-2相同的预训练视觉组件,其中该组件由EVA-CLIP的ViT-G/14和Q-Former组成。

3,整合:MiniGPT-4 添加了一个线性投影层,将编码的视觉特征与Vicuna语言模型对齐,冻结了所有视觉模型和语言模型参数。

4,Tuning:最后作者收集了另外 3,500 个高质量对齐的图像文本对,使用设计的聊天模板进一步微调模型,以提高生成语言的自然性和可用性。

效果不错,以下为作者给出的一些例子:

在Hugging Face上可以试用,不过就是排队的人太多,用起来很慢。

整体感觉效果不错,问题和现在的LLama一样,就是对中文支持还有待提高。

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

在Ubuntu系统上部署MiniGPT - 4可以按照以下详细步骤进行: #### 1. 克隆项目仓库 ```bash git clone https://github.com/Vision-CAIR/MiniGPT-4.git cd MiniGPT-4 ``` 此步骤是从GitHub上获取MiniGPT - 4的代码仓库,并进入项目目录。这一步是后续操作的基础,通过克隆仓库可以获取到项目的所有代码文件配置信息 [^2]。 #### 2. 配置环境依赖 ```bash conda env create -f environment.yml conda activate minigpt4 ``` 使用conda创建一个虚拟环境,并根据`environment.yml`文件安装所需的依赖包。激活虚拟环境后,后续的操作将在该环境中进行,这样可以避免不同项目之间的依赖冲突 [^2]。 #### 3. 获取LLaMA权重并生成Vicuna模型权重 需要获取LLaMA权重,并结合Vicuna的bitwise XOR增量文件完成Vicuna模型权重生成。此步骤较为复杂,是部署MiniGPT - 4的关键环节之一,为后续模型的正常运行提供必要的权重数据 [^1]。 #### 4. 安装FastChat(可选) 如果需要使用FastChat相关功能,可以选择安装FastChat,有两种安装方法: - **pip方式安装**: ```bash pip3 install fschat ``` - **源码安装**: ```bash git clone https://github.com/lm-sys/FastChat.git cd FastChat pip3 install --upgrade pip pip3 install -e . ``` 安装完成后,开启服务: ```bash python -m fastchat.serve.cli --model-path /home/train/mycharm/new/vicuna ``` 若出现`ModuleNotFoundError: No module named 'rich'`报错,可执行以下命令安装`rich`包: ```bash python -m pip install rich ``` 再次执行开启服务命令即可 [^3]。 #### 5. 准备预训练的MiniGPT - 4模型 下载预训练的MiniGPT - 4模型文件,将其放置在合适的位置,为后续的模型推理做准备。 #### 6. 进行模型推理(Web UI方式示例) 新开一个窗口,执行以下命令,当进程完成模型的加载后,会看到「Uvicorn running on ...」,下面可能会有一些ERROR,无需理会: ```bash python3 -m fastchat.serve.model_worker --model-name 'vicuna-7b-v1.1' --model-path /home/train/mycharm/new/vicuna ``` 此步骤可以让用户通过Web UI的方式与MiniGPT - 4进行交互 [^5]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值