
计算机视觉
文章平均质量分 91
MrCharles
隐私
展开
-
LSTM CNN Transformer各有各的好处
I’ll list some bullet points of the main innovations introduced by transformers , followed by bullet points of the main characteristics of the other architectures you mentioned, so we can then compared them.TransformersTransformers (Attention is all you原创 2022-02-16 20:48:41 · 1881 阅读 · 0 评论 -
神经网络 (2)- Alexnet Training on MNIST
文章目录Win10 Anaconda下配置tensorflow+jupyter notebook环境AlexNet 识别MNISTWin10 Anaconda下配置tensorflow+jupyter notebook环境1.安装anaconda到Anaconda官网下载,我是用的是Anaconda3-4.8.0版本(Python3对应的是Anaconda3,Python2对应的是Anaco...原创 2019-05-01 13:47:02 · 1024 阅读 · 0 评论 -
神经网络 (1)- Alexnet
文章目录模型结构conv1层conv2层conv3层conv4层conv5层FC6全链接图:fc7全连接层:和fc6类似.fc8链接层:AlexNet是Hinton和他的学生Alex Krizhevsky在12年ImageNet Challenge使用的模型结构,刷新了Image Classification的几率,从此deep learning在Image这块开始一次次超过state-of-a...原创 2019-04-30 22:36:38 · 1138 阅读 · 0 评论 -
人脸识别有滥用风险,使用加密函数?
人脸识别已经走进生活的方方面面,笔者作为生物特征识别的研究者,对人脸识别等方面的新闻那是特别关注,很多人脸识别已经投入应用.譬如:小区即将在每个单元楼门口安装人脸识别门禁系统,下方附了一个二维码,要求业主自行扫码登记,上传人脸、身份证和房产证等信息。教师通过智慧校园人脸识别闸机系统进入校园考务人员运用“人脸识别”技术核验考生身份支付与认证商场流量统计、社区管理、养老金领取、办税认证、物品保存、景区出入与演出场所的检票等用于教学过程,以监控与管理学生的课堂行为.分析学生在课堂上的行为,并对异常行原创 2020-11-22 16:49:29 · 12058 阅读 · 12 评论 -
生物特征识别数据泄露事件
概述生物识别数据和传统的用户名密码不一样,密码丢失可以修改,使用新的密码,而生物数据例如指纹或者人脸,一旦丢失,无法更换。以下收集了最近比较严重的生物识别数据丢失事件,以飨读者。BioStar 2VpnMentor 的团队最近在安全平台 BioStar 2 中发现了一个巨大的数据泄露事件。BioStar 2 是一个基于 Web 的生物识别安全智能锁定平台。它是一个中心化应用程序,允许管理员...原创 2019-10-11 14:38:43 · 2592 阅读 · 0 评论 -
人脸识别的又一滥用案例:大数据杀熟,买房多付30W
笔者作为生物特征识别的研究者,对人脸识别等方面的新闻那是特别关注,眼下又看到了相关的新闻,对技术的应用的思考又更进一步。南方都市报报道发现,多家售楼处承认安装了人脸识别系统,更有房地产业内人士称,“类似的系统每一个公司都有”。而人脸识别,就是为了帮助房企判断某个购房者是什么类型、是谁的客户,佣金应该发给谁。同一套房屋,消费者从不同渠道购入,差价在几万元到几十万元不等。“货比三家”本是人之常情,但房企用上人脸识别之后,就等于将消费者“一拍定终身”。详见报道:https://www.sohu.com/a/4原创 2020-11-22 15:58:26 · 11830 阅读 · 0 评论 -
趣闻:ROC “Reciever Operating Characteristic“ 的来源
您可能想知道“ Reciever Operating Characteristic”的名称来自何处。ROC分析是第二次世界大战期间开发的“信号检测理论”领域的一部分,用于分析雷达图像。雷达操作员必须确定屏幕上的闪动代表的是敌方目标,一艘友好的舰只还是只是噪音。信号检测理论测量了雷达接收机操作员做出这些重要区分的能力。他们这样做的能力被称为Reciever Operating Characteristic。原创 2020-09-02 13:16:46 · 959 阅读 · 0 评论 -
VAE系解纠缠:从VAE到βVAE,再到β-TCVAE
转自该文。作者:佚 名 编辑:陈人和 前 言“演讲中,Bengio 以去年发布在 arXiv 的研究计划论文「有意识先验」(The consciousness prior)为主旨,重申了他与 Yann Lecun 十年前提出的解纠缠(disentangle)观念:我们应该以「关键要素需要彼此解纠缠」为约束,学习用于描述整个世界的高维表征(unconscious state)、用于推理的低维特征(conscious state),以及从...转载 2020-08-29 15:41:45 · 3576 阅读 · 0 评论 -
变分自编码器VAE
变分法简介变分自编码器VAE:原来是这么一回事 | 附开源代码原创 2020-08-24 11:34:49 · 464 阅读 · 0 评论 -
人脸识别与Disentangled Representation
disentangled representationdisentangled representation相关的研究已经逐渐变得热门。那么对于disentangled representation,究竟怎么解释呢?Bengio et al.说得是:A disentangled representation should separate the distinct, informative factors of variations in the data.Single latent units a原创 2020-08-24 09:36:44 · 3464 阅读 · 0 评论 -
Faces la Carte: 根据目击者描述自动生成目标人脸图像
Wang, Tianren, Teng Zhang, and Brian Lovell. “Faces la Carte: Text-to-Face Generation via Attribute Disentanglement.” arXiv preprint arXiv:2006.07606 (2020).原创 2020-08-20 20:43:57 · 2620 阅读 · 0 评论 -
Beginer入门:必须了解的有关图深度学习的所有知识
Beginer入门:必须了解的有关图论深度学习的所有知识机器学习风靡的今天,一旦科学与炒作赶上,它很可能会成为我们生活中一种常态。我们探索下一步的方法之一是采用新型的深度学习。Geometric Deep Learning。本文的重点是我们如何在图(graphs)上使用深度学习。了解图学习所需的两个先决条件就是名称本身。图论与深度学习。这是您需要了解的所有内容,以了解其本质并为这两个想法建立...原创 2020-04-02 18:53:40 · 5063 阅读 · 2 评论 -
Blahut-Arimoto algorithm Matlab源码
For a discrete memoryless channel, the capacity is defined aswhereanddenote the input and output variables of the channel respectively, and the maximization is taken over all input distribu...原创 2019-06-18 00:13:01 · 2195 阅读 · 0 评论 -
Matlab AlexNet 识别花
1. 首先,你要又并行计算的工具箱,在插件选项里面找到,安装即可2. 下载训练的数据集,采用matlab演示的材料即可https://matlabacademy-content.mathworks.com/3.3/R2017b/content/deeplearning_course_files.zip3. 运行训练脚本:The code below implements transfer lear...原创 2018-04-03 10:30:28 · 9361 阅读 · 3 评论 -
tensorflow识别验证码(1)-tensorflow安装,验证码生成
什么是TensorFlow? TensorFlow是Google开发的一款神经网络的Python外部的结构包, 也是一个采用数据流图来进行数值计算的开源软件库.TensorFlow 让我们可以先绘制计算结构图, 也可以称是一系列可人机交互的计算操作, 然后把编辑好的Python文件 转换成 更高效的C++, 并在后端进行计算.为什么要使用TensorFlow? TensorFlow 无可厚非地能被...原创 2018-02-14 12:06:26 · 1048 阅读 · 0 评论 -
综述:神经网络的优化-优化器,动量,自适应学习率,批量归一化
综述:神经网络的优化-优化器,动量,自适应学习率,批量归一化在本文中,我将讨论与神经网络优化有关的以下概念:优化面临的挑战动量适应性学习率参数初始化批量归一化优化面临的挑战当谈论神经网络中的优化时,我们其实是在讨论非凸优化问题(non-convex optimization)。与之对应,凸优化(Convex optimization)中,...原创 2020-01-09 21:08:33 · 13342 阅读 · 3 评论 -
综述: 3D Unet vs 2D Unet
使用傅立叶变换检测图像边缘几种经典的卷积卷积神经网络(CNN)已显示出实现多种计算机视觉任务的能力(例如图像分割)。分割任务主要有两种: 语义分割和实例分割。语义分割是对图像中的每个像素都划分出对应的类别,即实现像素级别的分类; 而类的具体对象,即为实例,实例分割不但要进行像素级别的分类,还需在具体的类别基础上区别开不同的实例。比如说...原创 2020-01-07 23:21:10 · 10038 阅读 · 1 评论 -
Tutorial教程:使用傅立叶变换检测图像边缘
Tutorial教程:使用傅立叶变换检测图像边缘通常,在进行图像处理时,您最终会探索各种方法来评估适合您特定需求的最佳方法。我将在这里讨论一种这样的方法,即傅立叶变换。什么是傅立叶变换?用最简单的术语来说,傅立叶变换有助于将进入的信号分解成其构造块。例如,考虑通过将两个或多个具有不同频率的正弦函数叠加而得到的信号f(x)。现在,仅查看f(x)的图,您将无...原创 2020-01-06 19:04:21 · 1418 阅读 · 0 评论 -
Text to face:寻找黛玉-从语言描述到人脸图像生成
Text to face (T2F):计算机如何帮助警察根据目击者口供生成犯罪分子人脸画像-从语言描述到人脸图像生成利用计算机模型,根据语言描述生成的人脸图像 寻找梅姨-开篇故事一“梅姨”,真实姓名不详,曾用名潘冬梅,平时以红娘为生,暗地里还倒卖孩子。现约65岁,身高1.5米,讲粤语,会客家话,曾长期在增城、韶关新丰等地区活动,涉嫌多起拐卖案件。经法院...原创 2020-08-20 11:49:33 · 2856 阅读 · 0 评论 -
Tutorial教程:知错就改,错了就罚,论训练深度学习如何选择损失函数
Tutorial教程:训练深度学习如何选择损失函数声明:本文为优快云首发,谢绝转载,商业转载请联系笔者MrCharles本人获取同意作为优化算法的一部分,必须重复估算模型当前状态的误差。这就需要选择通常称为损失函数的误差函数,该函数可用于估计模型的损失,以便可以更新权重以减少下次评估时的损失。神经网络模型从示例中学习输入到输出的映射,损失函数的选择必须...原创 2019-12-29 03:16:41 · 29261 阅读 · 12 评论 -
Tutorial教程:深度神经网络中使用的不同标准化/归一化技术-局部响应归一化vs批归一化
深度神经网络中使用的不同标准化/归一化技术***声明:本文为优快云首发,谢绝转载,商业转载请联系笔者MrCharles本人获取同意先来辨析一下名词解释。数据的归一化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在一些数据比较和评价中常用到。典型的有归一化法,还有比如极值法、标准差法。归一化方法的主要有两种形式:一种是把数...原创 2019-12-24 07:02:22 · 1667 阅读 · 1 评论 -
综述:什么是光流及其在深度学习中的应用
综述:什么是光流及其在深度学习中的应用声明:本文为优快云首发,谢绝转载,商业转载请联系笔者本人获取同意在现实生活中,那个人不会接触到视频呢?就拿每天使用的微信来说,朋友发送给你的短视频,朋友圈的视频,或者是抖音的搞笑小视频等等,亦或者E盘里面的苍老师。对于视频平台,总会遇到一个问题,如何在没有人工干预的情况下让系统知道用户上传的视频描述了什么?或者,具体点...原创 2019-12-20 18:43:11 · 38008 阅读 · 1 评论 -
综述:OCR简单入门
简介OCR或光学字符识别是最早解决的计算机视觉任务之一,因为在某些方面它不需要深度学习。因此,即使在2012年深度学习热潮之前,就有不同的OCR实现方式,有些甚至可以追溯到1914年。这使许多人认为OCR挑战已“解决 ”,不再是挑战。另一种类似信念是,OCR不需要深度学习,换句话说,将深度学习用于OCR实在是太大材小用了。任何从事计算机视觉或一般机器学习的人都知道,没有什么挑战现在可以确定是...原创 2019-12-18 02:44:45 · 13385 阅读 · 1 评论 -
综述:基于深度学习的语义分割-以及源代码
语义分割什么是语义分割?深度学习和计算机视觉社区中的大多数人都知道什么是图像分类:我们希望我们的模型告诉我们图像中存在单个对象或场景。分类是非常粗糙和high-level的。许多人熟悉目标检测,在其中我们试图通过在图像周围绘制边界框然后对框内的内容进行分类来对图像中的多个对象进行定位和分类。目标检测是mid-level,mid-level有一些非常有用且详细的信息,但是由于我们只是绘制边界...原创 2019-12-17 02:58:13 · 8723 阅读 · 1 评论 -
对倾斜的图像进行修正——基于opencv 透视变换
这篇文章主要解决这样一个问题:有一张倾斜了的图片(当然是在Z轴上也有倾斜,不然直接旋转得了o(╯□╰)o),如何尽量将它纠正到端正的状态。而要解决这样一个问题,可以用到透视变换。关于透视变换的原理,网上已经有一大推了,这里就不再做介绍了。这篇文章的干货是:对OpenCV晦涩难懂的透视变换接口的使用细节的描述;基于两套自己提出的自动选择顶点进行透视变换的可以运转载 2017-06-26 14:24:36 · 24276 阅读 · 7 评论 -
linux,ubuntu根据条件筛选文件夹
有文件夹如下:我想筛选数字开头的文件夹,并且数字是0-3,怎么办?ls -d ./[0-3]*-d 表示列出文件夹,不然就是列出所有文件原创 2019-11-26 22:55:54 · 1110 阅读 · 0 评论 -
ubuntu批量转换所有子文件夹下图片文件格式
第一步按照sudo apt-get install imagemagick对于一个文件,可以:convert ubuntuhandbook.png ubuntuhandbook.jpg对于多个文件:for i in *.png ; do convert "$i" "${i%.*}.jpg" ; done...原创 2019-11-13 04:35:06 · 715 阅读 · 0 评论 -
同一子网建立ssh通道,映射到本地
在办公室有一台机器连入VPN网络,开启jupyter-notebook但是只能在这台机器上访问到,怎样可以在家也可以访问呢?此时最简单的方法是在本地建立一个ssh通道:在本地终端中输入ssh username@address_of_remote -L127.0.0.1????127.0.0.1:8888便可以在localhost:1234直接访问远程的jupyter了。...原创 2019-11-12 20:28:16 · 373 阅读 · 0 评论 -
机器学习线性模型-自定义模型
例:尝试一个线性模型让我们来使用目前为止学到的概念—Tensor,Variable,和 GradientTape—来创建和训练一个简单的模型。一般需要下面这些步骤:定义模型定义损失函数获取训练数据通过训练数据运行模型,使用 “optimizer” 来调整变量以满足数据在这个教程中,我们使用一个简单线性模型作为示例:f(x) = x * W + b,有2个变量- W 和 b。另外,我们会...原创 2019-11-12 17:57:10 · 920 阅读 · 0 评论 -
Ubuntu桌面突然卡住,图形界面无反应
1.可能等待几分钟,系统会自动反应过来。你可以选择等待几分钟。2.绝大多数情况系统是不会反应过来的,这时候可以进入tty终端直接注销用户。(1)Ubuntu有6个tty终端,按住Ctrl+Alt+F1可以进入tty1终端,(同理Ctrl+Alt+F2,F3等可以进入其他的tty1终端,这里我们只需要进入一个tty终端就能解决问题)。(2)进入tty终端后先输入你的用户名和密码登录。(3)执...原创 2019-10-23 22:44:13 · 4426 阅读 · 0 评论 -
服务器断电之后通电自动开启
设置BIOS >> seting >>advanced >>Power Management setup >>将Restore after AC Power Loss 设定为"Power ON"。一通电就能开机了,亲测有用,非常方便。原创 2019-04-22 12:12:51 · 2323 阅读 · 0 评论 -
一文尽览近似最近邻搜索中的哈希与量化方法
来自 微软研究院AI头条 编者按:最近邻搜索算法能够帮助人们在海量数据中快速搜索到有效内容,但是想要将其应用于实际,则需要解决如何缩短搜索时间的问题。本文将为大家介绍两种减少搜索时间的方法。基于哈希的近似最近邻搜索的方法通过设计和优化哈希函数,减少计算的次数,从而缩短搜索时间。基于量化的近似最近邻搜索方法则通过聚类把向量集聚成若干类,每类里面的向量用对应的类中心来近似。我们每个人每天都...转载 2019-02-23 18:12:47 · 2484 阅读 · 0 评论 -
InsightFace源码以及pre-train模型以及使用
一下摘自:https://blog.youkuaiyun.com/Fire_Light_/article/details/79602705论文链接:ArcFace: Additive Angular Margin Loss for Deep Face Recognition作者开源代码:https://github.com/deepinsight/insightface这篇论文原名是ArcFace,但...原创 2018-10-06 13:33:39 · 21783 阅读 · 3 评论 -
无法解析的外部符号 jpeg_std_error
1>dlib.lib(png_loader.obj) : error LNK2001: 无法解析的外部符号 png_set_sig_bytes1>dlib.lib(png_loader.obj) : error LNK2001: 无法解析的外部符号 png_sig_cmp1>dlib.lib(png_loader.obj) : error LNK2001: 无法解析的外部符号...原创 2018-08-18 16:36:22 · 4567 阅读 · 1 评论 -
tensorflow识别验证码(2)-tensorflow 编写CNN 识别验证码
1. 导入依赖包#coding:utf-8from gen_captcha import gen_captcha_text_and_imagefrom gen_captcha import numberfrom gen_captcha import alphabetfrom gen_captcha import ALPHABETimport numpy as npimport ten...原创 2018-02-14 15:15:22 · 4162 阅读 · 0 评论 -
Tutorial教程:骰子点数识别之图像分割 (3)
链接1:利用卷积神经网络识别骰子点数链接1:利用神经网络识别骰子点数前言前段时间借用神经网络和卷积神经网络实现了骰子点数的识别,但是一个很严重的问题一直困扰我,那就是当两个骰子叠在一起的时候,将两个骰子分开并不是一件简单的事情。下图是我在识别过程中产生的不能识别的,叠加在一起的图片素材。面对这些形态各异的图片,有的时候是两个骰子一个角连在一起,有的是一条边,有的是三个...原创 2017-01-05 13:55:51 · 11161 阅读 · 5 评论 -
matlab之原始处理图像几何变换
(一)图像几何变换理论知识(1)图像的平移与比例 图像的平移很简单,平移前后的坐标分别为(x,y)和(x’,y’),则满足的关系式为 x’= x +Tx; y’= y +Ty;其中Tx与Ty分别为对应的偏移量。 图像的比例也很简单,可以描述为:x’=S_x * x; y’=S_y * y;那么上述的关系怎么用一转载 2017-01-01 16:43:57 · 1556 阅读 · 0 评论 -
Tutorial教程:利用卷积神经网络识别骰子点数(2)
承接上文 利用神经网络识别骰子点数前言小叙前一段时间通过bpnn反向传播神经网络实现了识别骰子点数的目标,而且效果不错,我们的识别率可以达到80%上下,其实已经可以应用于生产环境了。只不过读了卷积神经网络,第一次感受到原来还可以这样,感受到了新的世界观和人生观。卷积这个词,第一次接触还是读图形处理的书的时候,中间会有卷积和滤波处理图片的内容,其实当时对于卷积也是懵懵懂懂,不明所以,...原创 2016-12-28 17:20:47 · 14712 阅读 · 3 评论 -
BP 算法之一种直观的解释
0. 前言之前上模式识别课程的时候,老师也讲过 MLP 的 BP 算法, 但是 ppt 过得太快,只有一个大概印象。后来课下自己也尝试看了一下 stanford deep learning 的 wiki, 还是感觉似懂非懂,不能形成一个直观的思路。趁着这个机会,我再次 revisit 一下。本文旨在说明对 BP 算法的直观印象,以便迅速写出代码,具体偏理论的链式法则可以参考我的下一篇博转载 2016-12-27 12:14:42 · 1295 阅读 · 0 评论 -
Tutorial教程:利用神经网络识别骰子点数(1)
前言小叙机器学习,Machine Learning走进我的视野范围,过程还挺有意思。第一次听到这个词还是在Blacksburg的公寓,王俊鹏向我介绍了计算机研究领域的几大方向,其中就有机器学习,人工智能。给我举得例子就是语义识别,不断给计算机喂书,然后拿出来一本计算机从来没有见过的书,计算机便可以知道这句话的意思,表达出来。这个月初,在Prof. Jin 的推荐之下,开始了MachineLea...原创 2016-12-25 23:03:05 · 9557 阅读 · 1 评论