
计算机视觉
文章平均质量分 85
林仔 Lin
这个作者很懒,什么都没留下…
展开
-
kaggle学习计划之Herbarium 2022 - FGVC9
因为代码偏弱,我迫切想要针对图像识别各个模块进行进步,kaggle是一个很好的学习代码比赛,里面会分享很多参赛者的思路,甚至有机会可能学习到其代码和具体实现方法!这周学习的内容,我同样找到了一个农作物的识别比赛,上面针对医学识别和农作物识别还是挺多的,在这里我将记录一下作者的一些想法,方便我后期的学习和使用。用subcenter-arcface代替cross-entropy loss。(最近针对图像的swin模型确实很好,有很大的发展空间!这边的话就是增加公共数据集来提高精度。(粗体是我要看的模型)原创 2022-09-13 16:05:34 · 502 阅读 · 0 评论 -
Kaggle学习计划之高粱 -100 品种鉴定 - FGVC 9
因为代码偏弱,我迫切想要针对图像识别各个模块进行进步,kaggle是一个很好的学习代码比赛,里面会分享很多参赛者的思路,甚至有机会可能学习到其代码和具体实现方法!!!这周学习的内容,我找到了一个农作物的识别比赛,但是服务器所需配置貌似很高,到时候我得实验一下看看能否正常运行,在这里我将记录一下作者的一些想法,方便我后期的学习和使用。原创 2022-09-09 14:57:44 · 528 阅读 · 0 评论 -
三维视觉:视觉跟踪
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由董秋雷老师为我们讲述相关知识】【本章节内容针对视觉跟踪进行讲解】接下来我们将主要针对以下内容进行介绍:目标跟踪 模板匹配法 基于Kalman滤波器的跟踪方法 基于相关滤波的跟踪方法 基于CNN的跟踪方法 视觉定位 基于Kalman滤波器的定位方法 基于关键帧的定位方法运动分析的一般流程Tracki...原创 2022-05-04 12:15:41 · 1628 阅读 · 0 评论 -
三维视觉:运动分析下篇
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由董秋雷老师为我们讲述相关知识】【本章节内容针对运动分析进行讲解】接下来我们将主要针对以下内容进行介绍:• AdaBoost • 基于DNN的物体检测目标检测 研究目标:自动确定目标在图像中的位置和类别。• 常规的目标检测方法 –AdaBoost • 基于DNN的目标检测方法 –RCNN系列 –YOLO系列A原创 2022-04-28 19:25:04 · 2278 阅读 · 0 评论 -
三维视觉:运动分析上篇
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由董秋雷老师为我们讲述相关知识】【本章节内容针对运动分析进行讲解】接下来我们将主要针对以下内容进行介绍:•混合高斯模型 • 光流 • 帧间差分 运动分析的定义:在不需要人为干预 的情况下,综合利用计算机视觉、模式识别、图像处理、人工智能等诸多方面的知识对摄像机拍录的图像序列进行自动分析,实现对动态场景中人的定位、跟踪和识别, 并在此基础上分析..原创 2022-04-27 17:19:28 · 3394 阅读 · 0 评论 -
计算机视觉——三维视觉III:立体视觉与三维建模
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由申抒含老师为我们讲述相关知识】【本章节内容针对立体视觉与三维建模进行讲解】接下来我们将主要针对以下内容进行介绍:• 视差(Disparity)与深度(Depth) • 立体视觉(Stereo) • 多视图立体重建(Multiple View Stereo)...原创 2022-04-24 19:22:33 · 5084 阅读 · 0 评论 -
计算机视觉——三维视觉II
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由申抒含老师为我们讲述相关知识】【本章节内容针对相机标定与稀疏重建进行讲解】接下来我们将主要针对以下内容进行介绍:• 三角化:已知x、K、R、t,求X • 相机标定:已知x、X,求K、R、t • 姿态估计:已知x、X 、K ,求R、t • 稀疏重建:已知x,求K、R、t、X • 重投影误差最小化 • 通过线性方法求解初始原创 2022-04-01 17:54:10 · 3388 阅读 · 0 评论 -
计算机视觉——三维视觉 I
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由申抒含老师为我们讲述相关知识】【本章节内容针对相机模型和多视几何进行讲解】接下来我们将主要针对以下内容进行介绍:射影空间小孔相机成像模型基本矩阵F,如8点法等一. 计算机视觉发展历史从Marr最开始的图像处理到Hinton提出深度学习,甚至延续到现在,也就40年的时间,也就意味着计算机视觉此时只是处于一种前期发展,更需要人们去投入心思发现其奇原创 2022-03-26 16:13:42 · 7108 阅读 · 0 评论 -
计算机视觉——图像分割(下篇)
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【本章节内容针对图像分割进行讲解】因为上篇已经介绍了早期的图像分割方法和基于特定理论的方法,这章节我将详细介绍基于深度神经网络的图像分割 :FCN、SegNet、R-CNN首先我们先介绍相应的基础内容:一般视觉方面的用途包括分割、分类等等,如下图【左图只考虑像素来进行分类,右图对多个对象进行分类,并且设置不同的方框来划分】语义分割思想:滑动窗口原创 2022-03-21 00:03:08 · 3570 阅读 · 0 评论 -
计算机视觉——图像分割(上篇)
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【本章节内容针对图像分割进行讲解】接下来我们将主要针对以下内容进行介绍:早期的图像分割方法 基于特定理论的方法 :Mean Shift 、Normalized Cut、Graph Cut 基于深度神经网络的图像分割 :FCN、SegNet、R-CNN一.早期图像分割方法:1. 阈值法* 2. 区域生长法 3. 分裂合并法 4. 基于边缘原创 2022-03-16 12:02:07 · 7470 阅读 · 0 评论 -
计算机视觉——特征点提取、描述与匹配
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【本章节内容针对特征点提取、描述与匹配进行讲解】SIFT特征点检测其性质:• 不变性 对图像的旋转和尺度变化具有不变性 对三维视角变化和光照变化具有很强的适应性 局部特征,在遮挡和场景杂乱时仍保持不变性 • 辨别力强 特征之间相互区分的能力强,有利于匹配 • 数量较多 一般500×500的图像能提取出约2000个特征点 •...原创 2022-03-10 15:19:15 · 4261 阅读 · 0 评论 -
LeNet-5卷积神经网络参数介绍
随着时间的推移,计算机视觉的魅力不断展现,包括各类模型我们都可以直接进行网上下载,但是往往我们就会忽略了模型的一些细节所在,正好在课程学习中老师提及这块内容,我觉得很有必要记录下来给大家借鉴学习,借此我将针对LeNet-5这个第一个卷积神经网络进行相关介绍。【相关论文可查阅:Y. Lecun, L. Bottou, Y. Bengio and P. Haffner, "Gradient-based learning applied to document recognition," in Pro原创 2022-03-03 14:33:29 · 1644 阅读 · 1 评论 -
基于tensorflow实现图像描述
【基础翻译自:Attention Mechanism For Image Caption Generation in Python 借鉴于:Python中图像标题生成的注意机制实战教程_Together_CZ的博客-优快云博客】该文内容主要是针对图像描绘从最基础的baseline:NIC模型开始到引出Attention,并且与Transformer模型进行性能比对,在源内容上进行拓展以及更新。主要针对学期大作业内容进行讲解。任务定义:图像描述是结合了计算机视觉和自然语言处理两个研究..原创 2022-02-23 15:51:17 · 4050 阅读 · 6 评论