又是子豪兄来做讲解,记得本科时候做树莓派相关的内容的时候就看到了子豪兄的很多分享,后来在接触CV的过程中也看了不少子豪兄分享的干货。再次膜拜一下大佬。
此前也算接触过MM相关的库,但是这次整体的介绍还是给了很多启发,以下就按照自己的理解来写一些感悟吧。
如果在记录的过程中有错误的地方,也请大家指出。欢迎讨论!
OpenMMLab是什么
OpenMMLab其实并不是一个框架,因为本质上还是基于PyTorch来实现底层的算法。MM最方便的是社区中的小伙伴们已经在相同的配置环境下完成了主流模型的复现,并在相同的基准上进行比较,给出了相对公平的对比环境。相信不少人在复现论文的过程中都会碰到各种各样的麻烦,代码不开源导致同一个算法有多种复现代码,也不知道哪一个版本是最接近作者的实验。即使是开源的代码,可能论文和代码也不是一一匹配,甚至不同的论文看似用的是同一个metric,但在代码中的计算是不同的。这些种种问题都导致在跑实验的时候很闹心。
但是MMLab这一个算法体系能够非常好的解决这一个问题。以我使用过的MMDet为例,首先是直接提供了大多数常见的单阶段、两阶段算法,经典和前沿的都有。此外还有提供各个组件,backbone、neck、loss等等。出了目标检测,实例分割、对比学习、知识蒸馏等算法也是支持的。
OpenMMLab各个算法库
MMDetection这是最常用的库,也是最基础任务。其中可能是因为YOLO一枝独秀的原因,所以单独对其开设了MMYOLO库。Yolo确实是非常方便的算法,特别是对算力较差的设备特别友好,用s甚至n的权重模型就能进行训练推理。虽然还没有用过MMYOLO,但是Yolov5的官方仓库给了我非常好的体验感,相信MMYOLO也是如此。
MMOCR的适用范围也非常广泛,其实我一直觉得OCR是落地非常成熟的产业,应该是值得更多研究的,特别是对于泛化能力、部署能力的优化。毕竟识别文字是日常生活中非常大的需求,早期的O

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



