学习资料

本文档概述了视觉探测学习的基础理论与实践路径,包括数字图像处理、卷积神经网络、机器学习、深度学习和机器视觉等关键技术领域的学习资源推荐,并提出了基于深度学习的目标检测算法实现的具体步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习资料及视觉自主探测学习初步规划


2018.03.31

我们研究的问题,在理论方面主要涉及到以下几个关键词:数字图像处理、卷积神经网络、机器学习、深度学习、机器视觉

针对这几个关键词,如果希望对相关领域的理论知识有所了解的话,有以下学习资料可以参考:

数字图像处理

  • 《数字图像处理》(冈萨雷斯)有两个版本,一个主讲理论基础,另一个主讲matlab实现,这本书主要是讲一些图像处理的基本知识和相应操作,普及图像处理能够做到哪些事,可以算作是图像处理的入门级读物,直接看书内容比较多的难接受的话可以去网上找相应的读书笔记(csdn上有很多)看看了解了解。
  • 相应的工具:matlab里的Image Processing Toolbox,主要就是直接调用别人写好的函数来实现自己的应用,而不是从底层的处理方法上自己开发,不过简单好用,适用于一版的图像处理问题,可以了解一下,我们实验室的一些师兄就主要是用这个的,但我还没怎么用过。

卷积神经网络

  • 掘金上的一篇博文,对卷积神经网络有个初步的了解
  • 斯坦福的课程CS231n: Convolutional Neural Networks for Visual Recognition,看英文视频难度有点大,可以先看知乎上该系列课程的全套笔记和翻译,还挺详细的,这个强推

机器学习

深度学习

  • 看书实在太烦的话,可以先看看博客对这方面有个感性的认识:深度学习笔记整理,csdn或者博客园之类的地方应该还有很多其他的优秀笔记也可以参考看看
  • Lan Goodfellow的《Deep learning》,这个就以后再说吧,是部大巨头

机器视觉

  • 相应工具:Opencv,这个感觉比matlab的工具箱功能更强大一点,不过matlab里面的东西都是大牛写的有保证,也简单好用,适用语言有C++和python

注:有想到新的资料我后续更新

实践方面,以如何实现一个基于深度学习的目标检测算法为主要技术路线

主要分为以下几个方面:

  • 深度学习环境配置
  • 图像采集

    • 了解数据集,针对任务寻找相应可用数据集
  • 在无可用数据集的情况下,以kinect为例学习自己采集相应数据并进行数据预处理等相应操作

  • 图像清洗
    • 以VOC2007为例学习标准数据集的数据结构及组织形式
    • 基于现有标注工具,针对具体任务需求开发相应适宜的标注工具
  • 基于深度学习开源框架实现相应相应算法
    • 对深度学习开源框架的大致了解
    • 以现有开源算法为例,学习数据加载、网络构建、图像预处理、图像增强、自定义操作等关键步骤
    • 深度卷积神经网络的训练及相关技巧
  • 将训练好的网络用于任务中

最后,我们用到的编程语言应该会以python居多,还有相关的linux下的基本文件操作等也是需要的,不过不用着急,可以用到的时候可以再去查,平时注意积累

以上提到了很多的书、课程以及工具,有些我也没看过没学过,希望大家一起努力

另外一些我搜集的资料(持续更新)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值