人工智能的时代
欢迎大家迈入人工智能的大门
首先给大家介绍一下什么是人工智能?
人工智能 (Artificial Intelligence, AI) 是当前全球最热门的话题之一,是21世纪引领世界未来科技领域发展和生活方式转变的风向标,人们在日常生活中其实已经方方面面地运用到了人工智能技术,比如网上购物的个人化推荐系统、人脸识别门禁、人工智能医疗影像、人工智能导航系统、人工智能写作助手、人工智能语音助手等等。它的五大核心技术包括:计算机视觉、机器学习、自然语言处理、机器人、语音识别。
人工智能是一门什么学科
人工智能科学的主旨是研究和开发出智能实体,在这一点上它属于工程学。工程的一些基础学科自不用说,数学、逻辑学、归纳学、统计学,系统学、控制学、工程学、计算机科学,还包括对哲学、心理学、生物学、神经科学、认知科学、仿生学、经济学、语言学等其它学科的研究,可以说这是一门集数门学科精华的尖端学科中的尖端学科——因此说人工智能是一门综合学科。
----------------------
人工智能的动作来看这四家:百度、谷歌、微软、Facebook
人工智能已经成了兵家必争之地,但说句实在话,也都是准备的姿势。不过,瞭望未来的AI大战,积极的人才、设施、技术储备都是刚需。近日,美国《财富》杂志(Fortune)发表题为“Why deep learning is suddenly changing your life“的文章,文中深入介绍了包括百度、谷歌、微软、Facebook在内的全球四大AI巨头在人工智能的布局以及深度学习对人们日常生活带来的改变。
下面来看一下这四家公司备战人工智能都做了什么⬇️
----------------------
一、百度在深度学习与人工智能领域的进展与成果
(一)百度人工智能
-
百度硅谷人工智能实验室,兼具开发与研究能力
人工智能实验室,成立于2014年5月,侧重于研究人工智能和深度学习的前沿技术,这使得百度在硅谷现有开发能力的基础上,进一步增强其研究能力。实验室搭建了百度人工智能的产品“百度大脑”,融合了深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了实时学习和成长,它拥有200亿个参数,构成了一套巨大的深度神经网络。目前实验室主要研发方向为:语音识别、图像识别、imageQ&A、自动驾驶技术等。
-
百度人工智能人才培养:“少帅计划”——人工智能实验室青年科学家甄选及培养计划
“少帅计划”招聘对象是人工智能领域30岁以下的年轻研究人员,从知识、行动、表达、创新和梦想等五方面进行考察,,不看资历和学历,只看能力和潜力,对于入选“少帅计划”的顶尖人才,百度设计了一整套培养计划:一年后,获得不少于半年赴百度美国硅谷研发中心工作机会,或者去美国麻省理工学院(MIT)、斯坦福大学(Stanford)等顶尖院校担任访问学者;三年后,经考核有机会获得“百度天使投资”,带领20-30人团队,独立领导一个创新项目。
百度创新性的利用大量GPU组成HPC(高性能计算机群),用其训练深度学习。研究人员通过提高GPU的使用效率,从而提升训练神经网络的速度及规模。百度在HPC的研究已处于世界领先地位。为提供在线神经网络的速度与规模,百度开发了FPGA加速器、GPU加速器加速技术提供在线服务,速度提升五倍左右。
- 算法:深度学习:
百度深度学习主要依靠硬件及算法模仿类似于大脑神经突触联接的结构进行信息处理的模型,它让机器执行人类的活动,如看、听和思考,为模式识别提供了可能性,促进了人工智能技术的进步。正是受益于Deep Learning领域的技术突破,百度在图像、语音方面取得了骄人的成绩。
为了顺应移动时代的潮流,百度正将深度学习模型小型化的同时,加快运行速度,致力于开放适用于手机、平板等移动设备的深度学习引擎。
百度在构建深度语音端对端系统的过程中发明了Warp-CTC方法,进而使用CTC提高模型的可伸缩性,该算法比普通CTC训练快百倍。百度还将这一算法开源,此举将加快推进深度学习研究者的研发成果,大幅提高人工智能开发速度,让端到端的深度学习变得简单、快速。
(二)百度人工智能技术进展与应用
概述:
百度在人工智能方面布局已久,关键技术的进展十分迅猛,目前在语音识别、图像识别、自然语言处理、无人驾驶、机器学习、深度学习等人工智能相关领域共公开了1500余件发明专利,遥遥领先于微软、IBM等公司。其中,深度语音识别系统于2月入选《麻省理工科技评论》2016十大突破技术,百度也被选入全球50大创新公司。
- 百度大脑
组成百度大脑的三大部分:超大规模神经网络、计算、数据。
-
百度超大规模神经网络是模拟人脑神经元组成的网络,但却比人脑的神经元数量多一个量级,支持万亿级参数、千亿样本、千亿特征训练。
-
“百度大脑”的计算基于数十万台服务器,以及国内最大的GPU集群。
-
百度拥有海量数据,包括全网万亿网页、数十亿级搜索数据、百万级图像视频数据、百万级定位数据。
“百度大脑”主要包含语音、图像、自然语言处理、用户画像四大能力。
目前,百度的语音及图像能力相对成熟;自然语言处理仍处于早期阶段,因为除了认知能力外还要求具备推理、规划等能力;用户画像可根据用户的数据进行处理,描绘出每个人专属的特征。
-
语音能力
-
语音识别技术:百度深度语音识别技术Deep
Speech2入选《麻省理工科技评论》“2016年十大突破技术”。目前,百度语音识别准确率为97% -
语音合成技术:百度语音合成技术已应用到百度各个产品中,每天响应的语音合成请求量达到2.5亿次,以手机百度小说频道为例,听小说的用户从过去听40分钟,增长到现在的近两个半小时,并利用该技术复原张国荣的声音。“百度大脑”的语音合成能力只需要按照要求说50句话,便可以让每个人拥有自己的声音模型。
-
图像能力
-
人脸识别:百度人脸识别准确率达到99.7%,该技术可识别人脸上的72个特征点,并将这些特征点连结起来形成面部表情网,可据此识别每个人的各种表情。
-
OCR识别:采集全景图片,利用OCR技术,自动进行目标识别,实现百度地