计算机视觉基础与OpenMMlab入门

本文介绍了计算机视觉作为机器学习的重要分支,从传统特征提取如HOG和SIFT到深度学习模型,特别是卷积神经网络(CNN)的转变。提到了OpenMMLab作为深度学习时代的全面计算机视觉开源平台。文章还概述了机器学习的基本类型,包括监督、无监督和半监督学习,并通过一个简单的PyTorch示例展示了神经网络的训练过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

计算机视觉

简介

计算机视觉(Computer Vision)又称为机器视觉(Machine Vision),顾名思义是一门“教”会计算机如何去“看”世界的学科。在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。而计算机视觉也由诸如梯度方向直方图(Histogram of Gradient, HOG)以及尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)等传统的手办特征(Hand-Crafted Feature)与浅层模型的组合逐渐转向了以卷积神经网络(Convolutional Neural Network, CNN)为代表的深度学习模型。

方向

比较基础和热门的几个方向主要包括了:

图像识别

语义分割

目标检测

视觉问答

开源成为AI领域发展引擎

随着深度学习、计算机视觉等学科的发展,各大研究机构和公司陆续开源自己的深度学习框架,论文发表同时开源代码也成了行业内的习惯和共识

OpenMMlab

OpenMMLab是深度学习时代最完整的计算机视觉开源算法体系。OpenMMLab 自 2018 年开源以来,累计发布超过 15 个算法库,涵盖分类、检测、分割、视频理解等众多算法领域,有超过 250 种算法实现和 2000 个预训练模型。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值