openmmlab-环境配置

本文档详细介绍了如何在Ubuntu环境中创建虚拟环境,安装Jupyter、PyTorch、CUDA、MMCV、MIM以及MMDetection。通过mim工具安装并测试了mmdet2.22.0,还涵盖了MMOCR的安装和基本使用。最后,作者提到在Ubuntu中遇到的Jupyter图像显示问题,并计划解决。
部署运行你感兴趣的模型镜像

1.创建虚拟环境,添加jupyter虚拟环境

conda create -n mmo python=3.7
conda activate mmo
conda install ipykernel
conda install nb_conda

p.s. 也是从这个地方发现之前的文章配的内核有问题,开始用这个方法配ju虚拟环境,还不错没啥问题了!
也可顺手升级一下pip至最新

python -m pip install --upgrade pip

2.装对应版本的torch,cuda110->pytorch1.7.0

conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=11.0 -c pytorch

3.装mmcv

pip install mmcv-full==1.3.17 -f https://download.openmmlab.com/mmcv/dist/cu110/torch1.7.0/index.html

mmcv版本选择:
https://mmcv.readthedocs.io/en/latest/get_started/installation.html
4.装mim

pip install openmim

测试:

!mim install mmdet==2.22.0
!mim search mmdet --model 'mask r-cnn'
!mim download mmdet --config mask_rcnn_r50_fpn_2x_coco --dest .

5.装mmdet

mim install mmdet==2.22.0

测试Demo:

import os
os.environ['CUDA_VISIBLE_DEVICES']='5'
from mmdet.apis import init_detector,inference_detector,show_result_pyplot
config_file = 'mask_rcnn_r50_fpn_2x_coco.py'
check_point_file = 'mask_rcnn_r50_fpn_2x_coco_bbox_mAP-0.392__segm_mAP-0.354_20200505_003907-3e542a40.pth'
model = init_detector(config_file,check_point_file)
print(model)
Demo='demo.jpeg'
result = inference_detector(model,Demo)
show_result_pyplot(model,Demo,result)

显示那张神椅就大功告成了!剩下的就是去搞数据训自己的模型了!

6.装mmocr
mmocr版本选择:
https://mmocr.readthedocs.io/en/latest/install.html
这里选择0.5.0
https://github.com/open-mmlab/mmocr/archive/refs/tags/v0.5.0.zip
直接github下载然后upload离线安装

cd mmocr0.5.0
pip install -r requirements.txt
pip install -v -e .
export PYTHONPATH=$(pwd):$PYTHONPATH

测试Demo:

from mmocr.utils.ocr import MMOCR
ocr = MMOCR()

results = ocr.readtext('demo/demo_text_ocr.jpg', details=True,print_result=True, imshow=False)

Ubuntu暂时还没弄懂怎么在jupyter显示图片展示,可以把imshow改为False,出现text识别就算大功告成!

今天暂时到这里吧,显示图片这个问题搞的opencv 删了又装,结果ocr又识别不了了,又得重装,特此记录,这次整理连写带装花了1个多小时,比第一次装mmd搞了一整个晚上快多了(就是昨天…)
赶紧睡觉去了,配环境搞的人都麻了,淦!2022-06-12 01:22:25

参考:SJTU open-mmlab 公开课B站,有手把手教芒果检测!

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

### OpenMMLab 超分辨率工具箱简介 OpenMMLab 是由开放多媒体实验室开发的一系列开源项目集合,涵盖了计算机视觉领域的多个方向。其中,超分辨率工具箱(MMEditing)是一个专注于图像编辑任务的框架,支持多种超分辨率算法实现[^3]。 #### 工具箱的主要功能 MMEditing 提供了丰富的超分辨率模型实现,包括但不限于 ESRGAN、RRDBNet 和 SRCNN 等经典网络结构。这些模型能够显著提升低分辨率图像的质量,适用于医学影像处理、视频增强等多个领域[^4]。 以下是 MME Editing 的一些核心特性: - **模块化设计**:允许用户轻松定制和扩展不同的组件。 - **多任务支持**:除了超分辨率外,还支持修复、去噪等多种图像编辑任务。 - **高性能训练与推理**:通过 PyTorch 实现高效计算,并提供分布式训练选项。 #### 安装指南 为了使用该工具箱,需先安装必要的依赖环境。推荐按照官方文档中的说明操作: ```bash git clone https://github.com/open-mmlab/mmediting.git cd mmediting pip install -r requirements.txt pip install mmcv-full==latest+torch1.8.0 -f https://download.openmmlab.com/mmcv/dist/cu111/torch1.8.0/index.html pip install . ``` 上述命令会克隆仓库并完成基础配置[^5]。 #### 使用方法 运行预定义的超分辨率脚本非常简单。例如,加载已训练好的 ESRGAN 模型并对单张图片执行测试: ```python from mmedit.apis import init_model, restoration_inference import cv2 config_file = 'configs/restorers/esrgan/esrgan_x4c64b23g32_1xb16-400k_div2k.py' checkpoint_file = 'https://download.openmmlab.com/mmediting/restoration/gan/esrgan/esrgan_x4c64b23g32_1xb16-400k_div2k_20220731-f9ebd7df.pth' model = init_model(config_file, checkpoint=checkpoint_file) result = restoration_inference(model, ['test_image.png']) output_img = result[0].cpu().numpy() # 将结果转换为 NumPy 数组 cv2.imwrite('super_resolved_output.png', output_img) ``` 此代码片段展示了如何初始化模型以及对输入图像应用超分辨率技术[^6]。 --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值