计算机视觉
简介
计算机视觉(Computer Vision)又称为机器视觉(Machine Vision),顾名思义是一门“教”会计算机如何去“看”世界的学科。在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。而计算机视觉也由诸如梯度方向直方图(Histogram of Gradient, HOG)以及尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)等传统的手办特征(Hand-Crafted Feature)与浅层模型的组合逐渐转向了以卷积神经网络(Convolutional Neural Network, CNN)为代表的深度学习模型。
方向
比较基础和热门的几个方向主要包括了:
图像识别
语义分割
目标检测
视觉问答
开源成为AI领域发展引擎
随着深度学习、计算机视觉等学科的发展,各大研究机构和公司陆续开源自己的深度学习框架,论文发表同时开源代码也成了行业内的习惯和共识

OpenMMlab
OpenMMLab是深度学习时代最完整的计算机视觉开源算法体系。OpenMMLab 自 2018 年开源以来,累计发布超过 15 个算法库,涵盖分类、检测、分割、视频理解等众多算法领域,有超过 250 种算法实现和 2000 个预训练模型。