
CV
kakak_
这个作者很懒,什么都没留下…
展开
-
语义分割常用metric
Pixel acc:比较预测label和实际label,像素级别误差。对于位置的偏移过分敏感,肉眼不可见的偏移都会产生大量的像素误差。IOU: 交并比,DetectionResult与Ground Truth的交集比上它们的并集。只是从单个像素点本身去考虑该点的预测是否与label重合,而没有从全局去考虑预测的整体形状是否与label结果形状吻合。混淆矩阵(Confusion Matrix)分别统计分类模型中归错,归对类的观测值的个数,然后把结果放在一个表里展示出来。矩阵对角线上的数字,为当.原创 2020-05-15 17:52:49 · 2070 阅读 · 0 评论 -
语义分割常用loss
对像素进行分类的损失函数Log loss交叉熵,二分类交叉熵(BCE),即keras.losses.binary_crossentropyBCE=−y∗log(y′)−(1−y)∗log(1−y′)BCE = -y*log(y')-(1-y)*log(1-y')BCE=−y∗log(y′)−(1−y)∗log(1−y′)最终的loss是y=0和y=1两种类别的loss相加。这种方法有一个明显缺点,当正样本数量远远小于负样本的数量时,即y=0的数量远大于y=1的数量,loss函数中y=0的成分就会占据原创 2020-05-09 11:36:27 · 1329 阅读 · 0 评论 -
Keras callbacks
Keras.callbacksmy_callbacks = [ tf.keras.callbacks.EarlyStopping(monitor='acc', patience=2), tf.keras.callbacks.ModelCheckpoint(filepath='model.{epoch:02d}-{val_loss:.2f}.h5',monitor='val_loss',save_best_only=True), tf.keras.callbacks.ReduceLR原创 2020-05-08 23:14:21 · 201 阅读 · 0 评论 -
Keras model
Keras model.fit()fit(x=None, y=None, batch_size=None, epochs=1, verbose=1, callbacks=None, validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None, initial_epoch=0, steps_per_epoch=None, validation_steps=None, va原创 2020-05-08 22:41:36 · 175 阅读 · 0 评论 -
Keras.preprocessing.image
图像生成器keras.preprocessing.image import ImageDataGenerator-flow(self, X, y, batch_size=32, shuffle=True, seed=None, save_to_dir=None, save_prefix='', save_format='png')-flow_from_directory(directory)...原创 2020-05-07 20:06:25 · 3696 阅读 · 0 评论 -
CNN网络架构演进
CNN网络架构CNN从90年代的LeNet开始,21世纪初沉寂了10年,直到12年AlexNet开始又再焕发第二春,从ZF Net到VGG,GoogLeNet再到ResNet和最近的DenseNet,网络越来越深,架构越来越复杂,解决反向传播时梯度消失的方法也越来越巧妙。上面那图是ILSVRC历年的Top-5错误率,我们会按照以上经典网络出现的时间顺序对他们进行介绍。本文将会谈到以下经典的...原创 2020-02-16 00:27:52 · 368 阅读 · 0 评论 -
github下载指定文件
From GitURL to SVNURL根据分支不同,通用的办法是将”/branches/branchname/”替换成”/trunk/”。svn checkout your code svn checkout SVNURL https:// github.com/... svn co SVNURL...原创 2020-04-26 18:47:31 · 137 阅读 · 0 评论 -
语义分割分割常用网络
语义分割图像的语义分割是将输入图像中的每个像素分配一个语义类别,以得到像素化的密集分类。一般的语义分割架构可以被认为是一个编码器-解码器网络。编码器通常是一个预训练的分类网络,像 VGG、ResNet,然后是一个解码器网络。这些架构不同的地方主要在于解码器网络。解码器的任务是将编码器学习到的可判别特征(较低分辨率)从语义上投影到像素空间(较高分辨率),以获得密集分类。不同于分类任务中网络...原创 2020-04-26 16:25:30 · 18456 阅读 · 1 评论 -
深度学习常用数据集
MNISTMNIST是一个手写数字数据库,它有60000个训练样本集和10000个测试样本集,每个样本图像的宽高为28*28。此数据集是以二进制存储的,不能直接以图像格式查看,不过很容易找到将其转换成图像格式的工具。最早的深度卷积网络LeNet便是针对此数据集的。主页链接ImageNetImageNet数据集有1400多万幅图片,涵盖2万多个类别。其中有超过百万的图片有明确的类别标注和图...原创 2019-12-29 12:27:20 · 490 阅读 · 0 评论 -
图像特征计算
图像信息量一幅图像如果共有k种灰度值,并且各灰度值出现的概率分别为p1,p2,···,pk,根据香农定理,图像的信息量为H=−∑i=1kpilog2piH = -\sum_{i=1}^k p_i log_2 p_iH=−i=1∑kpilog2piH称为熵,当图像各灰度值出现概率彼此相等时,图像的熵最大。...原创 2020-04-19 11:49:12 · 617 阅读 · 0 评论