- 博客(9)
- 收藏
- 关注
原创 python实现IoU
def GetIoU(A, B): ''' A[0],A[1]左上角坐标 A[2],A[3]右下角坐标 ''' min_x = min(A[0], B[0]) max_x = max(A[2], B[2]) min_y = min(A[1], B[1]) max_y = max(A[3], B[3]) w_A, h_A = A[2]-A[0], A[...
2019-12-30 15:53:40
316
原创 Pytorch中net.eval与net.train
我发现在有些网络中会存在net.eval()与net.train(),但是有一些却没有。查阅了一些说法,现在记录一下。这两个函数只要适用于Dropout与BatchNormalization的网络,会影响到训练过程中这两者的参数 net.train() 这个一般出现在训练函数中,也就是出现于 def train(): net.train() ... 运用net.train()时,训练时每...
2019-08-12 13:40:00
7856
1
原创 卷积神经网络中全连接层、softmax与softmax loss理解
一般一个CNN网络主要包含卷积层,池化层,全连接层,损失层等。 卷积层与池化层在本篇中不做多理解,之后有时间再记录一下,本篇着重讲一下全连接层与损失层。 —————————————————————————————————————— 全连接层: W为全连接层的参数,X是全连接层的输入,也就是特征,经上层卷积或者池化层输出。 从图中可以看出X是N1的向量,这是怎么得到的呢? 这个输入X就是由全连接层前...
2019-05-16 14:14:16
16486
1
原创 caffe solve.prototxt中的一些概念
1.test_iter=n,该参数表示 需要测试迭代的次数n。 test_iter* batchsize(测试集的)=测试集的大小 2.test_interval=n,该参数表示 训练的时候,每迭代n次就进行一次测试。 3.lr_policy,该参数表示 caffe进行深度学习时的学习策略,具体有: base_lr: 0.01 lr_policy: "fixed" max_iter: 40000...
2019-05-13 16:07:03
426
原创 python编码问题——“utf-8”与“gbk”
在进行CRNN训练中文字体OCR时,楼主碰到了令人头疼的问题,中英文编码不同。 这边文章主要来讲一下“utf-8”与“gbk”的一些问题,有人或许会问不是还有一个unicode吗?看完下面一张图就知道啦。 unicode其实是一种在操作过程中存在的字符状态,一般来讲,例如python中的str都是以“unicode”编码,在进行操作时会具化成为“utf-8”与“gbk”,往往是前者居多。 如上图...
2019-05-10 18:17:28
6542
2
原创 利用re.findall进行xml文件解析
本文主要用于记录从xml中提取相应的文本,并利用相对坐标进行截图。 import cv2 import re # xml文件路径 xml_path = './b2635430.xml' # 定义相应的pattern name_pattern = '<name>[\S]*?</name>' xmin_pattern = '<xmin>[\S]*?</xmi...
2019-05-06 16:26:43
1190
原创 从GitHub上Clone项目
不知道为什么每次博主想要从github上下载项目时网速都很糟糕,并且有几次下载之后会出现不能make的情况(caffe版本)。 clone和下载还是有些区别的,所以这篇文章用来记载一下从github上clone项目的方法。 博主系统为:ubuntu16.04 具体操作步骤为: 1.新建一个文件夹用来存放项目; 2.进入该文件夹,右击,选择Open Terminal Here,打开命令窗口; 3.在...
2019-04-26 14:57:18
2446
原创 使用Opencv结合Numpy截取图片
首先使用opencv读取图片。 img = cv2.imread(os.path.join(path, img_name)) # imread后面括号中的为图片的具体地址 用opencv读取的图片,可以理解为以numpy数组显示,所以很多操作可以通用。 img.shape = (900,1600,3) (900,1600,3)shape的三个参数,分别表示高度(矩阵行数),宽度(矩阵列数...
2019-04-24 14:44:29
1718
原创 Numpy Transpose 函数理解
最近在学深度学习时,碰到许多关于Numpy的知识点,边学边做点笔记,方便记忆。 此篇文章用来学习Numpy Transpose函数。 ———————————————————————————————— array = np.arange(0, 24).reshape(2, 4, 3) print(array) 得到一个三维矩阵: [[[ 0 1 2] [ 3 4 5] [ 6 7...
2019-04-22 17:15:07
2688
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅