关于CV的一些思考

--------------------------------------------------------------------人脸识别----------------------------------------------------------------

看到一段关于人脸识别的说明:

人脸识别是基于人的脸部特征,首先对输入的图像判断存不存在人脸,如果存在人脸,给出人脸的位置和大小信息,更进一步地给出面部特征位置信息。面部特征位置信息主要包括眼睛的位置、鼻子的位置、嘴的位置等。最后提取每个人脸的特征,来判断这个人是否是数据库中已经存在的人,或者比对两个人是否是同一个人。

本算法包含三个步骤:人脸检测、特征点定位、人脸特征提取。人脸检测算法的采用最新的深度人脸检测算法,在漏检率和误检率方面都优于传统的人脸检测算法。人脸特征提取算法是我们在已有的深度学习模型中加入了残差结构且使用了多个损失函数以确保同一个人学到的特征尽可能相似,不同的人学到的特征尽可能不相似,在实际场景中能达到理想的效果。

 

在一般的人脸识别步骤中,检测和抽特征耗时最久(上百毫秒),其次就是关键点定位(数十毫秒),剩余的矫正,特征比对等都在毫秒级别。因而快速有效的关键点定位技术对于人脸识别的性能提升帮助很大。

 

其实有关深度学习的换脸相关的研究已经很普及了,有基于 GAN 的也有基于 Glow 的,但本质上都是生成模型,只是换了一种实现方式,而这个DeepFake呢,使用的是机器学习中的 自编码器 ,拥有与神经网络类似的结构,鲁棒性较好,我们可以通过学习它来对生成网络有一个大概的了解,这样之后碰到相似的网络或者构造就好上手了。
---------------------------------------------------------------------------AR(增强现实)-------------------------------------------------------------

上次去上海市青少年人工智能大赛的开赛仪式上,遇到一家企业,主打产品是基于AR,大致了解之后,那家公司的主要业务大致是:辅助一些企业进行培训;与军方合作,通过建模的方式预测,飞机是否装载了炸药等危险品。对AR的了解一直不多,还停留在3,4年前,觉得AR就是做一些炫酷的视觉呈现的技术,但是看到一个比较可靠的报道称:预计到2023年,移动设备、智能眼镜等AR支持产品的用户基数将超过25亿。该行业的收入将达到750亿美元。很好奇该技术的应用方向以及发展轨迹,因为写下几个我认为的AR发展方向:

(1)文件,AR场景共享;

(2)展示,购物、看房,导航等;

(3)培训,AR以直观的方式(大型以及微型不可拆解情况均适用),辅助员工培训;

(4)与人工智能相结合,线上线下的便捷

(5)远程协助,手术等;

专家预测,到2025年,如下表所示,AR/VR行业的规模将超过250亿美元,并将继续稳步增长。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值