- 博客(24)
- 收藏
- 关注
原创 学习记录(六)(每日修改)
早在之前上NLP的课上,老师就多久强调文字的语义信息,之前一直是模糊的概念,而图像同样也具有这个信息内容,近期为了能想出一些比较好的点子,必须对一些细致的内容进行深刻的理解。得是我们所能看的东西,比如对一张人脸提取低层特征我们可以提取到连的轮廓、鼻子、眼睛之类的,那么高层的特征就显示为一张人脸。高层的特征语义信息比较丰富,但是目标位置比较粗略。图像的低层的特征语义信息比较少,但是目标位置准确;愈深层特征包含的高层语义性愈强、分辨能力也愈强。指的是:轮廓、边缘、颜色、纹理和形状特征。
2022-09-19 14:37:08
368
原创 kaggle学习计划之Herbarium 2022 - FGVC9
因为代码偏弱,我迫切想要针对图像识别各个模块进行进步,kaggle是一个很好的学习代码比赛,里面会分享很多参赛者的思路,甚至有机会可能学习到其代码和具体实现方法!这周学习的内容,我同样找到了一个农作物的识别比赛,上面针对医学识别和农作物识别还是挺多的,在这里我将记录一下作者的一些想法,方便我后期的学习和使用。用subcenter-arcface代替cross-entropy loss。(最近针对图像的swin模型确实很好,有很大的发展空间!这边的话就是增加公共数据集来提高精度。(粗体是我要看的模型)
2022-09-13 16:05:34
491
原创 学习记录(五)(每日修改)
我在看论文的过程中,发现了大多数作者针对模型刚开始会采用大的学习率,随着epoch或者层数的增加,而不断改变学习率的大小,我就很感兴趣(离全职调参又近了一步)。更新策略:每过step_size个epoch,做一次学习率更新,更新后的学习率为:new_lr = initial_lr *gamma。其中optimizer参数为优化器,需要提前设定,例如:SGD、Adam等。实际输出还是0,1,2,3。无法修改for中i的值。针对resnet101。
2022-09-13 11:04:56
460
原创 Kaggle学习计划之高粱 -100 品种鉴定 - FGVC 9
因为代码偏弱,我迫切想要针对图像识别各个模块进行进步,kaggle是一个很好的学习代码比赛,里面会分享很多参赛者的思路,甚至有机会可能学习到其代码和具体实现方法!!!这周学习的内容,我找到了一个农作物的识别比赛,但是服务器所需配置貌似很高,到时候我得实验一下看看能否正常运行,在这里我将记录一下作者的一些想法,方便我后期的学习和使用。
2022-09-09 14:57:44
518
原创 学习记录(四)(每日修改)
在上周我发现我训练的测试集样本都很低,我本以为是输入到的loss出现了问题,后来才发现对于softmax中dim=1我将其设置为0,导致精度,为此我了解了一下参数dim的意义!当 dim=2 或 -1 时,是对某一维度的行进行softmax运算;当 dim=1 时,是对某一维度的列进行softmax运算;相同位置的数值进行softmax运算;当 dim=0 时,是对每一。
2022-09-05 14:35:27
626
原创 学习记录(三)(每日修改)
在做分类情况中,我只有10分类的情况,所以在最后维度输出也是10,但是最终还是报IndexError: Target 10 is out of bounds。后来查了情况,说是因为标签是从1开始的原因,导致出现了这种情况解决方法:1.改变标签的起始,改成0开始(未尝试)2.将最终的输出维度增加1来测试。.....................
2022-08-29 15:47:02
1118
原创 Python---excel筛选
这次是想对excel的数据进行筛选功能,减轻一些数据负担,虽然excel自带了筛选功能,但是一个是需要一次次点击,另外若是存在多个数据,那么就会发现你所做的操作又重复又无聊。
2022-08-25 15:31:16
4584
原创 学习记录(一)(每日修改)
针对分类网络,最后一层需要进行softmax进行概率转化,最后需要选择出概率最好的点作为分类标准。shape[0]返回行数,shape[1]返回列数。shape[0]针对一维数组或者矩阵,返回其总个数。在网络设置中最后一层维度设置成1。dim=0#针对行计算。dim=1#针对列计算。...........................
2022-08-15 16:37:06
703
原创 Windows10安装pycharm+Anaconda+pytorch简单实现
这段时间刚刚进入实验室,因为老师给了一台新电脑,作为科研人的首要任务就是需要配置好环境从而更好的对接老师接下来的任务,因为大多数情况使用的框架是pytorch(虽然很多git上使用tensorflow实现的...),我将根据pycharm(python开发平台)+Anaconda(一堆库的综合包)+pytorch(一种框架)的顺序来搭建我的环境,其中包含了出现的bug和解决方案!参考内容。..................
2022-07-27 17:24:10
2066
原创 三维视觉:视觉跟踪
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由董秋雷老师为我们讲述相关知识】【本章节内容针对视觉跟踪进行讲解】接下来我们将主要针对以下内容进行介绍:目标跟踪 模板匹配法 基于Kalman滤波器的跟踪方法 基于相关滤波的跟踪方法 基于CNN的跟踪方法 视觉定位 基于Kalman滤波器的定位方法 基于关键帧的定位方法运动分析的一般流程Tracki...
2022-05-04 12:15:41
1610
原创 三维视觉:运动分析下篇
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由董秋雷老师为我们讲述相关知识】【本章节内容针对运动分析进行讲解】接下来我们将主要针对以下内容进行介绍:• AdaBoost • 基于DNN的物体检测目标检测 研究目标:自动确定目标在图像中的位置和类别。• 常规的目标检测方法 –AdaBoost • 基于DNN的目标检测方法 –RCNN系列 –YOLO系列A
2022-04-28 19:25:04
2266
原创 三维视觉:运动分析上篇
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由董秋雷老师为我们讲述相关知识】【本章节内容针对运动分析进行讲解】接下来我们将主要针对以下内容进行介绍:•混合高斯模型 • 光流 • 帧间差分 运动分析的定义:在不需要人为干预 的情况下,综合利用计算机视觉、模式识别、图像处理、人工智能等诸多方面的知识对摄像机拍录的图像序列进行自动分析,实现对动态场景中人的定位、跟踪和识别, 并在此基础上分析..
2022-04-27 17:19:28
3352
原创 计算机视觉——三维视觉III:立体视觉与三维建模
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由申抒含老师为我们讲述相关知识】【本章节内容针对立体视觉与三维建模进行讲解】接下来我们将主要针对以下内容进行介绍:• 视差(Disparity)与深度(Depth) • 立体视觉(Stereo) • 多视图立体重建(Multiple View Stereo)...
2022-04-24 19:22:33
5042
原创 计算机视觉——三维视觉II
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由申抒含老师为我们讲述相关知识】【本章节内容针对相机标定与稀疏重建进行讲解】接下来我们将主要针对以下内容进行介绍:• 三角化:已知x、K、R、t,求X • 相机标定:已知x、X,求K、R、t • 姿态估计:已知x、X 、K ,求R、t • 稀疏重建:已知x,求K、R、t、X • 重投影误差最小化 • 通过线性方法求解初始
2022-04-01 17:54:10
3354
原创 pycharm-----pyinstaller打包可执行文件
一.前言在本次这个模块,我将针对pycharm上使用pyinstaller打包exe文件的过程进行分析,包括一些bug的改正。本次环境是:python 3.8打包的类:matplotlib、numpy、cv2二.pyinstaller安装2.1 pycharm打开Terminal对话框:View->Tool Windows->Terminal2.2 安装pyinstallerpip install pyinstaller2.3 相关参数-F 打包成一个.
2022-03-29 19:52:48
3092
原创 计算机视觉——三维视觉 I
【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【从本章节开始由申抒含老师为我们讲述相关知识】【本章节内容针对相机模型和多视几何进行讲解】接下来我们将主要针对以下内容进行介绍:射影空间小孔相机成像模型基本矩阵F,如8点法等一. 计算机视觉发展历史从Marr最开始的图像处理到Hinton提出深度学习,甚至延续到现在,也就40年的时间,也就意味着计算机视觉此时只是处于一种前期发展,更需要人们去投入心思发现其奇
2022-03-26 16:13:42
7085
原创 计算机视觉——图像分割(下篇)
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【本章节内容针对图像分割进行讲解】因为上篇已经介绍了早期的图像分割方法和基于特定理论的方法,这章节我将详细介绍基于深度神经网络的图像分割 :FCN、SegNet、R-CNN首先我们先介绍相应的基础内容:一般视觉方面的用途包括分割、分类等等,如下图【左图只考虑像素来进行分类,右图对多个对象进行分类,并且设置不同的方框来划分】语义分割思想:滑动窗口
2022-03-21 00:03:08
3550
原创 计算机视觉——图像分割(上篇)
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【本章节内容针对图像分割进行讲解】接下来我们将主要针对以下内容进行介绍:早期的图像分割方法 基于特定理论的方法 :Mean Shift 、Normalized Cut、Graph Cut 基于深度神经网络的图像分割 :FCN、SegNet、R-CNN一.早期图像分割方法:1. 阈值法* 2. 区域生长法 3. 分裂合并法 4. 基于边缘
2022-03-16 12:02:07
7407
原创 计算机视觉——特征点提取、描述与匹配
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【本章节内容针对特征点提取、描述与匹配进行讲解】SIFT特征点检测其性质:• 不变性 对图像的旋转和尺度变化具有不变性 对三维视角变化和光照变化具有很强的适应性 局部特征,在遮挡和场景杂乱时仍保持不变性 • 辨别力强 特征之间相互区分的能力强,有利于匹配 • 数量较多 一般500×500的图像能提取出约2000个特征点 •...
2022-03-10 15:19:15
4243
原创 计算机视觉——特征检测
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【本章节内容针对图像特征进行讲解】瞳孔通过接收图像反射的光投射到视网膜上,神经元再将这种刺激传递给大脑,大脑做出反应,辨别出图像的类型。那么大脑是通过什么特征来辨别图像的呢?边缘和轮廓是两个必不可失的研究方向因此如果能对边缘和关键点可靠提取的话,很多视觉问题就基本上得到了解决!而图像边缘的产生源于物体的边界、表面方向的改变、不同的颜色、光照明暗的变化。
2022-03-09 14:56:18
3362
原创 LeNet-5卷积神经网络参数介绍
随着时间的推移,计算机视觉的魅力不断展现,包括各类模型我们都可以直接进行网上下载,但是往往我们就会忽略了模型的一些细节所在,正好在课程学习中老师提及这块内容,我觉得很有必要记录下来给大家借鉴学习,借此我将针对LeNet-5这个第一个卷积神经网络进行相关介绍。【相关论文可查阅:Y. Lecun, L. Bottou, Y. Bengio and P. Haffner, "Gradient-based learning applied to document recognition," in Pro
2022-03-03 14:33:29
1631
1
原创 基于tensorflow实现图像描述
【基础翻译自:Attention Mechanism For Image Caption Generation in Python 借鉴于:Python中图像标题生成的注意机制实战教程_Together_CZ的博客-优快云博客】该文内容主要是针对图像描绘从最基础的baseline:NIC模型开始到引出Attention,并且与Transformer模型进行性能比对,在源内容上进行拓展以及更新。主要针对学期大作业内容进行讲解。任务定义:图像描述是结合了计算机视觉和自然语言处理两个研究..
2022-02-23 15:51:17
4022
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人