
计算机视觉
FourierTransformer
这个作者很懒,什么都没留下…
展开
-
图像处理中的threshold
ret, dst = cv2.threshold(src, thresh, maxval, type)THRESH_BINARY:如果像素值大于thresh的话,就取maxval,其他情况的全部为0THRESH_BINARY_INV:这个根据名字就可以看出来和上面的刚好相反如果大于thresh的话,为0其他为maxvalTHRESH_TRUNC:这个顾名思义是截断,在数学证明中经常用到(本人是数学...原创 2018-03-24 10:03:20 · 2028 阅读 · 0 评论 -
ArcFace: Additive Angular Margin Loss for Deep Face Recognition 的阅读笔记
ArcFace 的笔记读的水平有限,欢迎指正,讨论。Abstract: This paper 提出了cos(\theta+m)的想法,相比之前的cos(m\theta)和cos\theta-m,ArcFace能够获得更好的区别性比较明显的deep features,this paper 也强调了网络结构以及数据的refinement在有脸识别领域的重要性,这个网络目前达到了state-of-ar...原创 2018-05-20 13:31:09 · 1723 阅读 · 0 评论 -
Squeeze-and-Excitation Networks 的理解
SE-Block 主要是考虑到了不同通道之间所占的重要性可能不一样,而以前的网络中并没有考虑到这一点,而是把所有通道的重要性当成一样来处理的。不同的通道的重要性是通过学到的一组权值来scale的,相当于经过加入权值进来之后,对原来的feature的一个重新的标定,具体的结构如下:相当于先将input(h*w*c)沿着size方向经过Squeeze操作变成(1*1*c)的,然后再经过Excitati...原创 2018-05-20 17:11:05 · 5511 阅读 · 1 评论 -
MobileNets的理解
注: 由于所写内容是读了文章之后,然后放在一边,用自己理解的话来写的,可能会与原paper不太一致,甚至可能理解的不对,敬请指正!读了paper的前面的介绍之后,一个整体的印象是这个network的设计复杂度和计算量都降了不少,而且performance也是不错的,网络的结构也比较的thin,可能这对于做模型压缩是一个启发。然后个人觉得这个paper的主要想法是做了一个分解,把以前正常的卷积,分解...原创 2018-05-20 17:39:54 · 1077 阅读 · 0 评论