媒体实录:百度林元庆第一时间解读百度大脑VS.最强大脑第一场

在《最强大脑》第四季的人机大战中,百度的小度机器人以3:2战胜了人类选手王峰。百度大脑凭借强大的人脸识别技术,在跨年龄识别的挑战中取得了胜利。百度深度学习实验室主任林元庆介绍了背后的技术难点及应用前景。
TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

昨晚23:20,《最强大脑》第四季人机大战第一场在江苏卫视落下帷幕。这场被称为跨越30年的“千脸识别”之战,经过了将近1小时的鏖战,以“百度大脑”派出的小度机器人3:2战胜王峰告终。

\

  王峰、郑才千、李威讨论谁对战小度

  比赛现场,人类选手在经过长达15分钟犹豫和怯场后,最后派出“世界记忆大师”王峰迎战百度大脑。比赛共分两轮,在第一轮比赛中,小度和人类选手需要通过分析照片中出现的幼年人脸,来识别出现场20年后的成年人,面对双胞胎识别这一难题,小度精准识别,以72.99%—高于第二张0.01%的识别率成功锁定目标,而名人堂王峰则1:0落败。

  在第二轮中,小度和王峰面对照片中出现的人数众多、现场实时照片传输、现场摄像机捕捉晃动、灯光干扰、化妆、微整形等影响,顶住压力,表现同样优秀,在30张共近千人脸的小学毕业照中成功选出了主人公。最终小度机器人以3:2击败名人堂选手王峰。

  为什么小度机器人能做到跨年龄识别的准确性?背后有什么不为人知的瞬间?在1月5日百度举办的人机大战提前观赛会上,百度深度学习实验室主任林元庆第一时间披露了人脸识别背后的技术难点,以及百度本次赴战背后的故事。

\

  百度深度学习实验室主任林元庆演讲中

  以下为演讲实录:

  林元庆:媒体朋友们,大家下午好!我是百度深度学习实验室的林元庆,今天也非常高兴代表百度的人工智能给大家分享一下我们参加这个比赛的一些心得。百度在人工智能起步的时候非常早,搜索里面用到非常多人工智能的技术,百度人工智能最核心的就是百度大脑,经过非常多年的积累,现在百度大脑拥有世界上最大规模的神经网络,万亿级别的参数,千亿的训练数据,亿级别的特征,这个是非常强大的人工智能系统。在最近开的世界互联网大会上,百度大脑也是唯一一个国内获奖的世界领先成果奖。

\

  我们最近也获得了人工智能四大巨头之一的称号,我们自己觉得这应该是代表了国内最高的人工智能的水平。这次参加比赛的主要是以深度学习实验室为主,主要是在计算机视觉和深度学习的平台、深度学习的平台在座的各位听说过,和谷歌的类似,只不过百度有百度的优势,在一些方面比它们做的更好。

\

  刚才我们看到的人脸识别,其实就是计算机视觉。这是我们深度学习实验室现在做的方向,人脸识别是其中的一个方向,这里面还有两个方向没有列,一个是智能驾驶,一个是增强现实。智能驾驶是2015年从深度学习实验室孵化出去的项目,专门成立了独立的事业部做智能驾驶。两个礼拜之前增强现实也独立出去,成立增强现实实验室,这两个都是深度学习实验室孵化出来的项目。因为这两个项目都已经做的非常好,我们觉得应该给它更多的空间发展,从实验室走到现实当中。

\

  这次《最强大脑》比拼的是人脸识别,蒋昌建老师也提到了,我们一直保持的是世界第一。2016年最看重的是一些营运,今年我们投入了非常大的力量,希望能够把人脸识别做成一个非常实用的技术。人脸识别在2016年有一些性能的提升,这是在我们内部非常难的测试集上,实际上从实际的应用里面来,我们把一些非常容易的去掉了,过去的这几年,2015年年底在这个测试集上最好的精度是8%的错误率。经过2016年的改进,9月份错误率降低到2.3%,这是非常大的降低。最后,我们希望能够把错误率降到1%以下,大家看到基本上有将近10倍左右的降低,这个是非常大的。我们平常说这个技术做的好,我们提高了20%、30%,这个是错误率降低了10倍,是非常棒的。

\

  我们今年选择参加《最强大脑》,在这里我解释一下图象识别这一块,人脸和人脑的识别不一样,比如说猫,就算是3岁的小孩,猫摆出不同的姿势,各种各样的猫都能够很好的识别。机器如果精确的识别,后面需要非常海量的数据训练,可能是成千上万的数据。训练的结果还不一定正确,下一次碰到姿势不一样的猫,有可能识别错。虽然我们人工智能技术过去几年取得了长足的进步,但是识别还是一个非常难的事情。

\

  《最强大脑》挑战的是比识别猫更难的,历史上有许多次的人机大战,比如说最近几天大家讨论的Master,之前的AlphaGo、深蓝等等。比如说针对下棋,空间还是有限的。识别需要一些模糊推理的能力,其实这里面还不是传统的计算器很擅长的。甚至我自己也把我的高中毕业照给一些同事看过,基本上是很难识别出来的。最后有同事识别出来,我说你们怎么识别?看气质。看气质的东西我说计算机怎么搞?这次和《最强大脑》做的几期节目,这些任务,比如说跨年龄的,第三期的遮挡,戴着口罩和大墨镜、帽子从上往下照,看到鼻子以下的部位,这些任务是大家公认没有解决好的问题,这些事情还是蛮难的,不是说大家都能做的很好的。

  这次百度也希望从综合的方面和人类比一下,最后能不能做的非常好。我们经过了很多年的研发,最后看一看我们和这些人类比,到底我们的水平在哪里。特别是我们这次的比赛,大家看王峰最后的题目做出来的时候,特别是非常强大的,我切身的体会到他们和普通人真的不一样,他们的能力非常强,这些题目确实是非常难的,不是很传统的识别,我们的对手还是非常强劲,比如说王峰。

\

  《最强大脑》今年早些时候找到我们的时候,也不知道这个节目能不能做好,因为这是前所未有的,没有一家公司在这方面专门做过这些内容,他们也不知道,在国内找了很多家公司看一看谁能做的比较好。这个是他们当时给我们的测试,当时基本上是《最强大脑》坐一排,百度的坐一排,把这些数据给我们,看一看你能做对多少个。但是在这上面,总共八个,我们只错了一个,难度还是蛮大的。从《最强大脑》的节目组来讲,看完了我们做的以后被我们震住了,选择百度和他们做这一档节目。这里面还看了语音的能力,综合来说百度在这方面非常强,最后他们选择和百度做这一期节目。

\

  过去两个多月的时间备战,准备上这个节目。我大概给大家一个概念,这里面到底做了哪些特别棒的事情。最后的人脸系统分两步训练的,第一步训练的是通用的人脸识别系统,不是专门针对跨年龄的,这次成功最关键的是这一块,训练了一个非常强大的人脸识别系统。我们的数据里面是两百万人,每个人有一百张照片,我们用一个非常大的数据训练我们的人脸识别系统,这是百度很多年积累起来的数据,这个过程的迭代是数据和算法一起迭代,这里面非常难的事情是你要有非常好的算法,充分利用这些数据。利用这些数据,你能设计出非常好的算法符合这些数据。

\

  这里给大家一个感性的认识,大家经常听到ImageNet一千类,150万张照片,我们大概是两百万类,类别我们是它的两千倍。如果按图片的数量来算,他们是150万,我们是两亿,基本上是一百多倍。如果把这些数据放在一起,看的是这样的内容。因此,在量级上差别还是非常大的。如果大家要训练的话,业界也得五天到七天,如果训练到这么大的数据,如果是一百倍的话得训练一年多,这里面有非常好的算法设计,包括很好的计算等等各个方面,我们能把这个模型训练起来。

\

  这是我们准备当中的花絮,要做成一件事情是很难的,特别和《最强大脑》比赛,这个过程很忐忑,也很兴奋。忐忑的是事情能搞定吗?兴奋的是终于有一个机会去看一看我们的人工智能技术做了这么多年,跟人还有多大的差距,或者是已经到达了什么样的水平。我个人从国庆开始就没有放假,一直到节目做完,基本上中间一天都没有放假,两三点这都是正常的,我的团队经常是三点、四点以至于到第二天,这个很正常。我觉得要做成一件事情,这是最基本的。比如说我们的同学在封闭的会议室里过生日,我加入百度大概一周年,大家一起庆祝。为了节目我们把人工智能的能力植入到小度身上,代表百度参加比赛,我们自己在这个过程中,觉得小度特别猛。

\

  大家可能也有疑问,百度做了这么多技术,亮点在哪里。现在我们做的人脸识别的门禁技术,在百度的大厦里已经落地了,百度整个公司有30条左右的闸机已经用了人脸识别系统,人走在那里稍微站一下直接就往里走,一秒到两秒的时间,不用卡了。这个技术是1比N的人脸识别,我们能做到非常高的精度,业界也是首创。之前市场上的系统是1比1的,比如说银行的应用里面,你要提交身份证和人脸的信息,系统会拿身份证照片比对一下是不是同一个人,一张比一张,一比一的比对,市场上基本是这个系统。公安抓逃犯的系统是1比N,精度不会做的特别高,用机器筛一遍,还是需要人去看的,1比N很难做到非常高的精度。我们这个系统第一次能够做到,百度目前的系统里大概是一万人,很精确的识别一万里面的一个人,或者这个人不在这个系统里,是外来的人,它就会拒绝掉你。我们现在是万级别,还能做到非常高的精度,这个绝对是国内首创,也是我们下面会重点来推的方向。

\

  这是在乌镇落地的项目,这个是它的注册系统,注册完了以后就可以往里走,现在很多景点有指纹识别系统,精度很难做的特别高,都是一比一的,过的时候出示一下身份证,小孩和老人的精度很难做。因为老人的指纹都磨损了,指纹通过基本上是在10秒左右一个人,我们这个系统是非常革命性的,我们是用人脸做的,1比N的,不需要再出示你的身份证,基本上通过率是一到两秒左右,非常快。在今年下半年,大家去景区,很多景区应该多会有这样的系统,如果你看到的话,一定是百度的系统。

\

  我们也会做1比1的系统,成功的在百度自己的产品上线,外部的泰康保险都会用,确实在性能上比目前市场上的竞品好很多。一些系统转过去要有一些成本,百度精度上做的非常好,原来用了别人的,现在转到用百度,我相信接下来会越来越多。

\

  当然,我们也很容易想到其他内容,在这方面我们也在推进,比如说公安方面识别罪犯,1比N做的非常好,原来的精度做的不够好。现在,我们希望百度这边能够做出非常高精度的1比N的人脸识别系统。甚至识别被拐卖的儿童,和打拐办也在推进,还有安防等等,很多和人脸识别相关的应用,后续都会大力推进。

\

  现在人工智能在接下来的五到十年里是一个非常重要的技术,我们后面人类和人工智能一定是共存的,我们百度更相信最后是人工智能帮助人类,比如说《最强大脑》这个节目不是宣传打败了人类,输赢我们不是最看重的,最重要的是看一看百度和中国的人工智能已经到了怎么样的水平,这是我们特别关心的。后面的五年、十年,甚至二十年、五十年,我们一定会跟人工智能的技术共存,希望我们把这些技术用好,帮助人类解决问题,而不是让这些技术成为人类的对立面。如果大家想做人工智能的可以加入像百度这样的公司,大家一起努力,把技术用到最好。

  这几期做节目的过程中也发现了,从旁观者的角度来看,挺值得我们思考的。比如说每一期的节目,如果是小度赢了,很多观众觉得蛮沮丧的,如果是人类赢了,大家会很欢呼。我觉得我们应该从另外一个方面看,比如说王昱珩说过人类发明汽车的时候,不会因为汽车比我们跑的快我们很沮丧。我们发明的这些技术最后是为我们所用的,这些技术会是未来的技术,这一次《最强大脑》的人机大战,我们也在思考怎么样和人工技术共存,怎么样更好的利用人工智能技术,谢谢大家!

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

【SCI一区复现】基于配电网韧性提升的应急移动电源预配置和动态调度(下)—MPS动态调度(Matlab代码实现)内容概要:本文档围绕“基于配电网韧性提升的应急移动电源预配置和动态调度”主题,重点介绍MPS(Mobile Power Sources)动态调度的Matlab代码实现,是SCI一区论文复现的技术资料。内容涵盖在灾害或故障等极端场景下,如何通过优化算法对应急移动电源进行科学调度,以提升配电网在突发事件中的恢复能力与供电可靠性。文档强调采用先进的智能优化算法进行建模求解,并结合IEEE标准测试系统(如IEEE33节点)进行仿真验证,具有较强的学术前沿性和工程应用价值。; 适合人群:具备电力系统基础知识和Matlab编程能力,从事电力系统优化、配电网韧性、应急电源调度等相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①用于复现高水平期刊(SCI一区、IEEE顶刊)中关于配电网韧性与移动电源调度的研究成果;②支撑科研项目中的模型构建与算法开发,提升配电网在故障后的快速恢复能力;③为电力系统应急调度策略提供仿真工具与技术参考。; 阅读建议:建议结合前篇“MPS预配置”内容系统学习,重点关注动态调度模型的数学建模、目标函数设计与Matlab代码实现细节,建议配合YALMIP等优化工具包进行仿真实验,并参考文中提供的网盘资源获取完整代码与数据。
一款AI短视频生成工具,只需输入一句产品卖点或内容主题,软件便能自动生成脚本、配音、字幕和特效,并在30秒内渲染出成片。 支持批量自动剪辑,能够实现无人值守的循环生产。 一键生成产品营销与泛内容短视频,AI批量自动剪辑,高颜值跨平台桌面端工具。 AI视频生成工具是一个桌面端应用,旨在通过AI技术简化短视频的制作流程。用户可以通过简单的提示词文本+视频分镜素材,快速且自动的剪辑出高质量的产品营销和泛内容短视频。该项目集成了AI驱动的文案生成、语音合成、视频剪辑、字幕特效等功能,旨在为用户提供开箱即用的短视频制作体验。 核心功能 AI驱动:集成了最新的AI技术,提升视频制作效率和质量 文案生成:基于提示词生成高质量的短视频文案 自动剪辑:支持多种视频格式,自动化批量处理视频剪辑任务 语音合成:将生成的文案转换为自然流畅的语音 字幕特效:自动添加字幕和特效,提升视频质量 批量处理:支持批量任务,按预设自动持续合成视频 多语言支持:支持中文、英文等多种语言,满足不同用户需求 开箱即用:无需复杂配置,用户可以快速上手 持续更新:定期发布新版本,修复bug并添加新功能 安全可靠:完全本地本地化运行,确保用户数据安全 用户友好:简洁直观的用户界面,易于操作 多平台支持:支持Windows、macOS和Linux等多个操作系统
源码来自:https://pan.quark.cn/s/2bb27108fef8 **MetaTrader 5的智能交易系统(EA)**MetaTrader 5(MT5)是由MetaQuotes Software Corp公司研发的一款广受欢迎的外汇交易及金融市场分析软件。 该平台具备高级图表、技术分析工具、自动化交易(借助EA,即Expert Advisor)以及算法交易等多项功能,使交易参与者能够高效且智能化地开展市场活动。 **抛物线SAR(Parabolic SAR)技术指标**抛物线SAR(Stop and Reverse)是由技术分析专家Wells Wilder所设计的一种趋势追踪工具,其目的在于识别价格走势的变动并设定止损及止盈界限。 SAR值的计算依赖于当前价格与前一个周期的SAR数值,随着价格的上扬或下滑,SAR会以一定的加速系数逐渐靠近价格轨迹,一旦价格走势发生逆转,SAR也会迅速调整方向,从而发出交易提示。 **Parabolic SAR EA的操作原理**在MetaTrader 5环境中,Parabolic SAR EA借助内嵌的iSAR工具来执行交易决策。 iSAR工具通过计算得出的SAR位置,辅助EA判断入市与离市时机。 当市场价位触及SAR点时,EA将产生开仓指令,倘若价格持续朝同一方向变动,SAR将同步移动,形成动态止损与止盈参考点。 当价格反向突破SAR时,EA会结束当前仓位并可能建立反向仓位。 **智能交易系统(EA)的优越性**1. **自动化交易**:EA能够持续监控市场,依据既定策略自动完成买卖操作,减少人为情感对交易的影响。 2. **精确操作**:EA依照预设规则操作,无任何迟疑,从而提升交易成效。 3. **风险管控**:借助SA...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值