Deep Learning 应用

本文介绍了多项基于深度学习的创新应用,包括为盲人解读照片、实时语音翻译、邮件自动回复等,展示了深度学习在人机交互领域的巨大潜力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

初识deep learning的时候,经常只是把它看成一种更好一些的机器学习分类算法而已;实际上,也可以用一个时兴的说法——它是一种“像人脑一样的”神经元计算。前一种说法大大低估了深度学习可以胜任的应用类型;而后一种说法又言过其实的认为它的能力已经超出了普通的人工智能,基于它的应用已经可以自如的处理实际问题了。

可能对于基于深度学习应用更为恰当一些的认识角度是——它改善了人机交互界面。深度学习系统确实看起来似乎具备了某种可以匹敌生物大脑的能力,例如,它们可以很有效的辅助进行通常由人类甚至是动物曾经被用来完成的工作。需要指出的是,深度学习系统于传统的字符计算系统确实有着很大的区别,这种差异就有如人类的思考方式与计算机的计算方式之间的区别。

然而,深度学习系统本质上还是依赖于传统的计算技术构建的,因此,深度学习系统也和普通计算机一样可以不知疲倦的持续高效工作。计算机在进行高精度的符号运算和推理方面大大超过人类,然而,深度学习系统还不具有处理复杂符号运算的能力,虽然它们本身就是植根于这种能力的。

利用深度学习构建的应用看上去非常的具有科幻色彩。这里仅从目前已经开发出来的神奇的深度学习应用中抽选一小部分。

为盲人开发的照片内容解读app 
Facebook开发了这款手机app用来为盲人描述一幅照片的内容。 
http://www.wired.com/2015/10/facebook-artificial-intelligence-describes-photo-captions-for-blind-people/

同声传译 
微软Skype已经能够实时的将语音翻译为多种语言,几乎就和星际迷航里的那款是一样一样滴。 
http://blogs.skype.com/2014/12/15/skype-translator-how-it-works/

邮件自动回复 
Gmail已经可以根据你之前的行为自动的回复邮件了。 
http://www.wired.com/2015/11/google-is-using-ai-to-create-automatic-replies-in-gmail/

物品识别 
Moodstocks (Google已收购)已经可以使用手机来辨别不同的物品。 
http://www.slideshare.net/CdricDeltheil1/moodstocks-mobile-image-recognition-paris-tech-talks-6

识别照片中场景的地理位置 
Google已经实现了仅仅通过分析照片场景识别出照片所拍摄的地理位置。 
https://www.technologyreview.com/s/600889/google-unveils-neural-network-with-superhuman-ability-to-determine-the-location-of-almost/

照片收藏夹整理 
Google Photos已经可以将你的相册按照公共分享的一些主题整理为不同的收藏夹。 
https://www.youtube.com/watch?v=JuFtW1PSYAU

对照片进行分类 
Yelp实现了可以自动将照片分类为不同业务类别的功能。 
http://engineeringblog.yelp.com/2015/10/how-we-use-deep-learning-to-classify-business-photos-at-yelp.html

自动驾驶汽车 
业余爱好者可以在几个小时内“教”会它的车如何自动驾驶。 
http://www.bloomberg.com/features/2015-george-hotz-self-driving-car/

谱曲 
音乐可以被基于不同的编写风格被编写出来。 
http://web.mit.edu/felixsun/www/neural-music.html

模仿画家风格的绘画 
可以模仿著名画家的绘画风格进行作画。 
https://nucl.ai/blog/neural-doodles/

* 新材料发现* 
借助于深度学习发现新的材料。 
http://www.nature.com/articles/srep02810

玩视频游戏 
Google DeepMind已经可以创建出仅仅通过观察就能够学会如何去玩视频游戏的系统。 
http://www.wired.co.uk/article/google-deepmind-atari

世界冠军级别的围棋对弈能力 
Google DeepMind开发了一个可以通过自己和自己对弈来学习新策略的围棋对弈系统。 
http://www.scientificamerican.com/article/how-the-computer-beat-the-go-master/

人脸识别 
人脸识别现在可能已经有点不新鲜了。 
https://cmusatyalab.github.io/openface/ 
http://gitxiv.com/posts/fDJ7nHHou57aLEjBQ/the-megaface-benchmark-1-million-faces-for-recognition-at

生成诱骗点击的标题 
一个RNN网络可以被训练用来生成诱骗点击的标题。 
https://larseidnes.com/2015/10/13/auto-generating-clickbait-with-recurrent-neural-networks/

黑白照片着色 
一个系统被训练用来为黑白照片着色。 
http://richzhang.github.io/colorization/

实时的将图像中的文字进行翻译 
Google开发了一款手机应用可以将从照片中找到的文字自动翻译成可以看懂的文本。 
https://research.googleblog.com/2015/07/how-google-translate-squeezes-deep.html

键盘击键预判 
Swiftkey正在设计制造一种手机键盘,它使得输入更加简单快捷。 
http://www.slashgear.com/swiftkey-neural-alpha-predicts-what-youll-type-08408912/

三维物品分类 
http://3dshapenets.cs.princeton.edu/

手势识别 
不同手势的含义可能将会成为我们和各种无屏电器设备一种新的交互方式。 
https://engineering.purdue.edu/cdesign/wp/deephand-robust-hand-pose-estimation/ https://atap.google.com/soli/

将照片中的人物面容变为笑脸 
SmileVector可以拍下一幅人像照片然后将其中人物面容变为笑脸。 
https://www.engadget.com/2016/06/27/twitter-bot-plasters-creepy-smiles-on-celebrities-faces/

拟人沟通 
Google创建了一个消息系统,它具有更加自然的沟通能力。 
https://research.googleblog.com/2016/05/chat-smarter-with-allo.html

增强现实-人脸跟踪 
Baidu创建了一个可以利用深度学习跟踪人脸的手机应用,该应用可以将一幅三维的面具图像覆盖在人脸上。 
http://research.baidu.com/happy-halloween-baidu-research-introduces-faceyou/

仓库优化 
一个深度学习系统被训练用来学习在仓库中存取货物的优化路径,这个系统比很多传统的运筹优化方法要快速。 
https://devblogs.nvidia.com/parallelforall/optimizing-warehouse-operations-machine-learning-gpus/

其他视觉应用 https://github.com/kjw0612/awesome-deep-vision

实时表情转换 
Stanford最近研究了如何将你的表情转移到另外一个人的脸上。这不是一个深度学习应用,让我疑惑的是,一个深度学习系统是不是也可以实现类似的功能。 
http://graphics.stanford.edu/~niessner/thies2015realtime.html realtime facial transfer

译者著:原作者对于深度学习的有些认识可能有待商榷,然而毕竟整理了很多有趣的深度学习应用,于是翻译过来留存启发。


源网址:http://www.deeplearningpatterns.com/doku.php/applications

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.youkuaiyun.com/solomonlangrui/article/details/51894287
'Written by three experts in the field, Deep Learning is the only comprehensive book on the subject.' -- Elon Musk, co-chair of OpenAI; co-founder and CEO of Tesla and SpaceX, Deep learning is a form of machine learning that enables computers to learn from experience and understand the world in terms of a hierarchy of concepts. Because the computer gathers knowledge from experience, there is no need for a human computer operator to formally specify all the knowledge that the computer needs. The hierarchy of concepts allows the computer to learn complicated concepts by building them out of simpler ones; a graph of these hierarchies would be many layers deep. This book introduces a broad range of topics in deep learning., The text offers mathematical and conceptual background, covering relevant concepts in linear algebra, probability theory and information theory, numerical computation, and machine learning. It describes deep learning techniques used by practitioners in industry, including deep feedforward networks, regularization, optimization algorithms, convolutional networks, sequence modeling, and practical methodology; and it surveys such applications as natural language processing, speech recognition, computer vision, online recommendation systems, bioinformatics, and videogames. Finally, the book offers research perspectives, covering such theoretical topics as linear factor models, autoencoders, representation learning, structured probabilistic models, Monte Carlo methods, the partition function, approximate inference, and deep generative models., Deep Learning can be used by undergraduate or graduate students planning careers in either industry or research, and by software engineers who want to begin using deep learning in their products or platforms. A website offers supplementary material for both readers and instructors.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值