modelscope 多模态环境配置及问题解决

1 创建python环境

首先,参考文档 安装配置Anaconda环境。 安装完成后,执行如下命令为modelscope library创建对应的python环境。

conda create -n modelscope python=3.7

完成后输入 如下命令进入环境

conda activate modelscope

2 安装pytorch

进入pytorch官网https://pytorch.org/get-started/locally/选择合适的版本,注意这里一定和自己的cuda版本一致,若当前页面没有自己的cuda版本,可以点击图中红字寻找历史版本。

在这里插入图片描述
如下图,根据自己的机器环境和CUDA版本选择,我的环境是Ubuntu系统,CUDA是10.2,因此选择下面红框的命令安装。
在这里插入图片描述

pip install torch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1

3 ModelScope Library 安装

1. PIP安装
ModelScope Libarary由核心框架,以及不同领域模型的对接组件组成。如果只需要ModelScope模型和数据集访问等基础能力,可以只安装ModelScope的核心框架:

pip install modelscope

如果需要进一步具体使用ModelScope平台上承载的,包括多模态,NLP,CV,语音等不同领域的模型,来进行模型推理以及模型训练、微调等能力,则需要安装各个领域上不同的依赖。例如,

如仅需体验多模态领域的模型,可执行如下命令安装领域依赖:

pip install "modelscope[multi-modal]" 

2. 源码安装
可通过从GitHub上下载ModelScope源码进行安装。适合本地开发调试使用,修改源码后可以直接执行。 ModelScope的源码可以直接clone到本地:

git clone git@github.com:modelscope/modelscope.git
cd modelscope
git fetch origin master
git checkout master

如需体验多模态领域模型,可执行如下命令安装依赖:

pip install ".[multi-modal]"

4 安装验证

安装成功后,即可使用对应领域模型进行推理,训练等操作。这里我们以NLP领域为例。安装后,可执行如下命令,运行中文分词任务,来验证安装是否正确:

python -c "from modelscope.pipelines import pipeline;print(pipeline('word-segmentation')('今天天气不错,适合 出去游玩'))"

5 安装问题

1. 报错no module named ‘open_clip’

pip install open_clip_torch

2. modelscope.preprocessors.multi_modal requires the decord library but it was not found in your environment.

pip install decord>=0.6.0

详细教程参见modelscope官网

### ms-Swift 多模态模型微调方法教程 #### 工具概述 ms-Swift 是由 ModelScope 提供的一个全面的大模型与多模态大模型微调和部署框架,涵盖了从训练到推理再到部署的整个流程[^2]。 #### 支持的模型类型 该框架支持多种类型的多模态模型,包括但不限于 Qwen2.5-VL、Qwen2-Audio、Llama3.2-Vision 和 DeepSeek-VL2 等。这些模型能够处理视觉、音频等多种形式的数据输入。 #### 微调的具体步骤说明 虽然不建议使用诸如“首先”这样的引导词,以下是关于如何利用 ms-Swift 对多模态模型进行微调的关键要点: - **环境准备** 需要先安装并配置好 ms-Swift 的开发环境,这通常涉及 Python 脚本以及必要的依赖库安装。具体可以参考官方文档中的快速入门指南[^3]。 - **数据集格式化** 自定义数据集需遵循特定格式以便于被框架识别和加载。例如,在对 deepseek-ai/Janus-Pro-7B 进行微调整时,应确保图片路径及其对应标签正确无误地记录在 CSV 文件或其他指定文件中。 - **启动微调过程** 使用命令行或者脚本来执行实际的参数更新操作。下面是一个简单的例子来演示这一环节: ```bash python finetune_ms_swift.py --model_name_or_path="path/to/model" \ --dataset_dir="path/to/dataset" \ --output_dir="path/to/save/fine-tuned-model" ``` 此脚本假设存在名为 `finetune_ms_swift.py` 的入口程序,并接受几个基本选项如原始模型位置(`--model_name_or_path`)、目标数据存储目录(`--dataset_dir`)以及最终保存地址(`--output_dir`)等参数设置。 - **评估与优化** 完成初步迭代之后,可以通过内置工具完成性能测试并与未修改版本对比效果差异;必要情况下还可以进一步调节超参直至达到满意水平为止[^1]。 #### 注意事项 值得注意的是当前版本可能仅限于某些特定功能领域内的改进工作——比如针对图像理解部分而非生成方面开展相应活动。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CV温故知新

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值