
干货文章
人工智能的干货,看这里就都有了。
「已注销」
等待转型中
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Keras VS PyTorch,总有一个理由让你选择它们
全文共3376字,预计学习时长7分钟对许多科学家、工程师和开发人员而言,TensorFlow是他们的第一个深度学习框架。TensorFlow 1.0于2017年2月发布;但客观来说,它对用户不是非常友好。过去几年里,由于Keras和PyTorch比TensorFlow更容易使用,这两个主要的深度学习库已得到较广的普及。本文将从四个方面来介绍Keras和Pytorch,以...原创 2019-08-13 10:41:25 · 2027 阅读 · 0 评论 -
IBM PowerAI Vision:极速创建计算机视觉应用程序
全文共2915字,预计学习时长6分钟机器学习包括自然语言处理(NLP)、计算机视觉、语音识别等等。计算机视觉问题极其复杂,目前提供的图像类似于对对象进行分类、识别或分割的像素矩阵。训练机器学习是一个迭代过程——通过调整不同的参数、超参数、重塑、添加或删除一个或多个层、连接或跳跃连接一个或多个残差块等来进行无休止的迭代。为了对在数据集上执行不同算法的大量操作进行简化统一,可以选择IBM ...原创 2019-08-12 17:58:36 · 811 阅读 · 0 评论 -
揭开LSTM结构的神秘面纱,让RNN变得完美
全文共2737字,预计学习时长5分钟图片来源:pexels.com/@chivozol-43727循环神经网络并不是完美的,其原因在于两大问题:梯度爆炸和梯度消失。发现梯度爆炸还比较简单,解决梯度消失就比较困难了。长短期记忆 (Long ShortTerm Memory, LSTM) 网络及门控循环单元 (GatedRecurrent Unit, GRU) 不仅能有效解决梯度消失问题,...原创 2019-08-04 08:48:49 · 662 阅读 · 1 评论 -
Jupyter Notebooks三大附加功能,好用到飞起!
全文共1786字,预计学习时长4分钟Jupyter Notebooks可以最有效地显示结果和共享代码,这在以前的IDEs中并不容易实现。然而,仍有些地方有待改进。在文本编辑器中,希望有一些功能在Jupyter中不是默认的。但别担心。就像Python一样,Jupyter也有第三方扩展功能。本文主要介绍一些最有用的扩展功能。1. 可折叠标题可折叠标题这项扩展功能使笔记本的流程更...原创 2019-08-04 08:46:04 · 2729 阅读 · 0 评论 -
不了解云端服务?这份AWS VPC入门指南带你飞
全文共2834字,预计学习时长6分钟图片来源:https://pixabay.com/illustrations/network-earth-block-chain-globe-3537401/作为开发人员,基本上其所有的注意力都集中于开发产品。不过一旦完成开发,还需要将该应用程序放在互联网平台上,提供给大众使用。如果在团队中工作,这个过程就不是问题,运营部有人会处理这项任务。...原创 2019-08-06 19:19:08 · 724 阅读 · 0 评论 -
Jupyter Notebooks三大附加功能,好用到飞起!
全文共1786字,预计学习时长4分钟Jupyter Notebooks可以最有效地显示结果和共享代码,这在以前的IDEs中并不容易实现。然而,仍有些地方有待改进。在文本编辑器中,希望有一些功能在Jupyter中不是默认的。但别担心。就像Python一样,Jupyter也有第三方扩展功能。本文主要介绍一些最有用的扩展功能。1. 可折叠标题可折叠标题这项扩展功能使笔记本的流程更...原创 2019-08-06 19:14:47 · 697 阅读 · 0 评论 -
Swift 5.1:颠覆!将你的代码减少一半
全文共7044字,预计学习时长14分钟图片来源:unsplash.com/@max_duzSwift 5.1增加了许多新功能,其中一些功能有望彻底改变编写和构建Swift代码的方式。那么,如何使用Swift 5.1 Property Wrappers(属性包装器)将依赖注入代码减少一半?本文讨论了Swift Property Wrappers,并演示一种可大大简化代码的方法。...原创 2019-08-05 08:31:31 · 1150 阅读 · 0 评论 -
代码详解:数据结构越来越复杂?试试Monocle的Optics库吧
全文共7490字,预计学习时长15分钟或更长图片来源:unsplash.com/@lysanderyuen在函数式编程中,必须保证其不变性。因此,每当需要修改数据结构的内容时,都会随之创建一个具有更新值的新实例。随着数据结构越来越复杂,创建副本就越来越繁琐。为了简化这一过程,技术人员设计了一组通常名为Optics的函数,以便简单地访问或修改整个数据结构的各个部分。这些函数必须遵守某...原创 2019-08-05 08:28:06 · 665 阅读 · 1 评论 -
阅读海量文献,如何从几个月压缩到几分钟?
全文共2517字,预计学习时长5分钟图片来源:pexels.com/@viktor-talashuk-191931如今这个时代,人们跟上科学文献出版的速度越来越难,研究者...原创 2019-08-02 12:13:01 · 535 阅读 · 0 评论 -
NLP VS NLU:彼此替代还是互相融合?
全文共2433字,预计学习时长5分钟图片来源:pexels.com/@pixabay随着人工智能的发展与技术的日益复杂化,人们希望现存的概念能做出调整或是适应这些变化。同样,在电脑辅助的自然语言处理领域,自然语言处理(NLP)这一概念是否要为自然语言理解(NLU)让步?这两个概念的关系是否更加微妙和复杂,而不仅仅只是一种技术的线性发展?本文将分辨自然语言处理和自然语言理解这两种概念...原创 2019-08-03 13:18:38 · 1018 阅读 · 0 评论 -
想让AI更安全可靠,从了解算法的泛化能力开始
全文共4016字,预计学习时长8分钟在新数据中,深度学习系统执行(泛化)能力如何?其性能如何?要想建立AI系统的信赖度和可靠性,必须估计算法的泛化能力。我们能信任AI吗?AI是否会像人类酗酒一样毫无顾忌?一但AI启动,是否会毁灭世界?统计学习理论意义何在?AI系统必须安全可靠,一旦启动AI,算法才能按预期执行。确保AI算法性能良好是提高其采用度和信任度的必由之路 [5]。此...原创 2019-08-03 13:27:46 · 862 阅读 · 0 评论 -
代码详解:轻巧!低廉!为自动驾驶汽车实施端到端学习
全文共3507字,预计学习时长7分钟过去十年,自动驾驶汽车标志着汽车行业的最大变化。所有主要汽车公司都投身于开发属于自己的自动驾驶汽车。自动化技术将是一个价值高达7兆美元的行业,同时会在未来挽救很多人的生命。本文将深入介绍如何使用卷积神经网络开发自动驾驶汽车。开发方法每当谈到自动驾驶汽车时,大多会谈论激光雷达(LIDAR) 、雷达(RADAR)、360度摄像头和昂贵的图形处理器(G...原创 2019-08-01 11:29:14 · 948 阅读 · 1 评论 -
接近人类智能!一文读懂计算机视觉中的深度域适应
全文共4378字,预计学习时长8分钟图片来源:pexels.com/@omarhouc在过去十年里,人们在计算机视觉领域取得了巨大进步。这一进展主要归功于卷积神经网络(CNNs)。如果使用高质量带有注释的训练数据进行训练,卷积神经网络可以进行非常精确的预测。例如,在分类设置中,通常可以使用其中一种标准化网络体系架构(ResNet,VGG等),并使用数据集对其进行训练,其结果可能表现优异...原创 2019-07-31 12:01:02 · 1336 阅读 · 1 评论 -
一文读懂贝叶斯推理问题:MCMC方法和变分推断
全文共6415字,预计学习时长20分钟或更长图片来源:pexels.com/@lum3n-com-44775贝叶斯推理(Bayesian inference)是统计学中的一个重要问题,也是许多机器学习方法中经常遇到的问题。例如,用于分类的高斯混合模型或用于主题建模的潜在狄利克雷分配(Latent Dirichlet Allocation,简称LDA)模型等概率图模型都需要在拟合数据时解...原创 2019-07-29 10:44:39 · 8500 阅读 · 2 评论 -
教你用ANNs,RNNs和LATMs构建“私人助理”
全文共3390字,预计学习时长7分钟你是否曾幻想过拥有一个私人助理,可以回答你的任何问题或者能够与你交谈?幸好有机器学习与深度神经网络,使得这一梦想不再遥远。想想苹果的Siri和亚马逊的Alexa的神奇功能吧!但也不要太激动,因为在接下来文章中要创建的并不是一个无所不能的人工智能,而仅仅是一个简单的聊天机器。它被输入了一些问题和相应的答案,人们向它提问时,它可以回答是或不是。它与S...原创 2019-08-01 11:25:43 · 726 阅读 · 0 评论 -
揭秘卷积神经网络热力图:类激活映射
全文共2280字,预计学习时长4分钟目前在可视化方面,我们已经掌握了许多不同的技术。本文将介绍在卷积神经网络(CNN)中,针对图像的某些部位可视化从而做出判断的不同技术。类激活映射(CAM)是一种生成热力图的技术,用于突出图像的类的特定区域。热力图效用下面是一个典型的热力图:图片来源:https://github.com/jacobgil/pytorch-grad-cam这张图片中...原创 2019-07-17 11:04:28 · 3461 阅读 · 1 评论 -
掌握代码背后的这种语言,让你一招通吃天下!
全文共3471字,预计学习时长7分钟图片来源:pexels.com/@pixabay在撰写本文时,搜索引擎中“应该学习哪种编程语言”这一问题已有5.17亿个搜索结果。每一网页都会阐述某种语言相对于其他语言的优势,其中90%的网页最终会推荐Python或JavaScript。但其实,最应该首先学习的编程语言是逻辑。学会如何编写代码已不再够用了。现在到处都是从培训班出来的毕业生,这一市场已经...原创 2019-07-15 18:41:38 · 668 阅读 · 0 评论 -
必看!今年最火的五大Python框架
由于简单的学习曲线、越来越快的应用程序以及机器学习辅助功能等附加优势,Python已经成了IT行业的流行词。到目前为止,几乎每个IT工程师和开发人员都必须了解Python的强度和功能。Python本身是一种编程语言,也许你已经掌握了这种令人惊叹的编程语言的一些基本编程技能,并且正在寻找更多途径来探索这种特殊语言。从下面的图表中也可以看出,Python的发展已超过其他编程语言:如果查看201...原创 2019-07-15 17:32:44 · 1348 阅读 · 0 评论 -
这篇微服务架构入门指南,7岁小孩也能学会
全文共2641字,预计学习时长5分钟图片来源:unsplash.com/@brookelark“我们的服务以可扩展的微服务架构为基础”,“我们正准备转向微服务架构”……如果你是一名开发人员,肯定经常听到上面两句话。但不少人都会很困惑——微服务架构到底是个啥?别担心!本指南会用现实生活中的例子让你深刻理解微服务架构——比如,7岁的小朋友都能听懂的冰淇淋的例子!一个大型冰淇淋机——一体化架构...原创 2019-07-14 19:47:59 · 520 阅读 · 0 评论 -
数据标记又出神器!用Create ML进行目标检测
全文共2053字,预计学习时长10分钟在2019年苹果全球开发者大会上,新发布的Create ML应用程序为训练个人化机器学习模型提供了极其容易的方法。你唯一需要做的就是将含有训练数据的文件夹拖至Create ML程序内,而它会完成剩下繁重的任务。那么应该如何准备数据呢?当进行图像和音频分类的时候,只需要把数据整理到文件夹里。但如果要进行目标检测,事情会复杂一些。在目标检测时就需要对一些附加...原创 2019-07-14 19:42:38 · 1028 阅读 · 1 评论 -
10个业余时间可完成的项目,助你飞速提升编码能力!
全文共4586字,预计学习时长9分钟图片来源:Aphinya Dechalert.在编程行业想要有好的职业发展,必须有足够的创造才能。那么,当你的创意枯竭或者不知道该如何培养创意时该怎么办?本文将给出十个编程提示,并附上要求指南,来给编程开发者提供一些思路和创意。下文的项目将提供商业化的全栈技能,并且都可以在一两个月内完成。如果把下班后和周末的时间都花在这些项目上,绝对是可以实现的。每个...原创 2019-07-14 12:53:02 · 553 阅读 · 0 评论 -
超详细Spring Boot面试问题集锦,死角一个不留!
全文共2564字,预计学习时长5分钟本文将讨论Spring Boot中最常见的10个面试问题。在当今就业市场中,这些问题出现的频率呈上升趋势并且有一些棘手。1. @SpringBootApplication注释在内部有什么用处?作为Spring引导文档,@SpringBootApplication注释等同于同时使用@Configuration、@EnableAutoConfiguration...原创 2019-07-14 12:35:50 · 590 阅读 · 0 评论 -
让强化学习逃离“乏味区域陷阱”,试着加点噪音吧!
全文共5013字,预计学习时长10分钟来源:南方公园如果你去咨询一位投资顾问,肯定首先得问他是如何收费的——是根据投资的回报来收费吗?“不是的。”他说,“我对你获得的回报预测越精确,你付给我的钱就越多。但我的预测只会在你选择的投资产品上得到验证。”这听起来似乎有些可疑,你开始咨询其他选择这位投资顾问的人。结果发现,他向客户推荐的都是低回报率、低变化性的政府债券。他甚至告诉所有客户这是最高...原创 2019-07-13 21:36:18 · 825 阅读 · 0 评论 -
办法不在多,有用就行!用Dropout解决过度拟合问题
全文共1878字,预计学习时长4分钟Dropout是一种用于解决训练模型时过度拟合问题的有趣方法。即便Dropout背后的概念非常简单,在培训模型时带来的改进也不可小觑。本文尽量以最简洁精炼的语言为你解释Dropout。除了叙述Dropout背后的客观现实之外,还包括如何应用于神经网络,以及在Keras上的应用。什么是过度拟合?训练神经网络是一大棘手难题。应该注意,其模型已足够完备,可...原创 2019-07-12 14:00:32 · 664 阅读 · 0 评论 -
掌握这十个优秀编程项目,让你的简历含金量暴涨
全文共3363字,预计学习时长7分钟图片来源:Unsplash/Jantine Doornbos学习编程时常见的一个问题是:设计程序时,什么样的想法算是好的?如今,大家会...原创 2019-07-11 12:21:49 · 2898 阅读 · 0 评论 -
这五种统计学概念,扫清数据科学之路“拦路虎”
全文共2551字,预计学习时长5分钟图片来源:pexels.com/@rawpixel数据科学实际上可定义为从数据中获取额外信息的过程。在进行数据科学研究时,真正想要达到...原创 2019-07-09 12:00:00 · 610 阅读 · 0 评论 -
如何让AI像放射科医生一样看懂胸片?
全文共2933字,预计学习时长6分钟目前,世界上70亿人口中,只有大约10%能获得良好的卫生保健服务,而世界上一半的人口甚至接触不到基本的卫生服务。即使在发达国家,医疗保健体系也压力重重,因为其成本不断上升,等待时间也很长。并且,想要在短时间内培养足够多的医生和护理人员来满足日益增长的需求也很不切实际。要想解决这个问题,就必须实现技术突破。这也正是机器学习(ML)和人工智能(AI)大有...原创 2019-07-29 10:41:43 · 1194 阅读 · 0 评论 -
好物推荐!Python的datatable程序包概述
全文共5270字,预计学习时长11分钟或更长图片来源:pexels.com/@divinetechygirl从文明之初到2003年,只创造了5艾字节的信息,但是现在每两天就有如此之多的信息产生。埃里克·施密特(Eric Schmidt)如果你是R使用者,可能你已经使用过data.table程序包。Data.table是R中数据帧程序包的延伸。涉及大型数据(包括RAM中1的1...原创 2019-07-28 14:22:14 · 1207 阅读 · 0 评论 -
构建React应用程序,请避开这十大禁忌
全文共2841字,预计学习时长6分钟图片来源:pexels.com/@bymalcolmgarretReact是一款很受欢迎的开发工具,性能优良。不过人无完人,React也一样。React有一些特有的注意事项——如果现在不进行处理,那么某一部分可能会造成应用程序的严重问题。下面将介绍构建React应用程序时的10大禁忌。1. 过于注重个人世界如果花费了大量时间编写代码,而没...原创 2019-07-28 13:23:55 · 598 阅读 · 0 评论 -
10个Python简单技巧,让数据分析速度加快不止一倍!
全文共3915字,预计学习时长8分钟有时,在编程领域的一个小技巧、一个小的快捷方式或附加组件能极大地提高生产力。下文中的建议和技巧有些可能很常见,有些则较新颖,相信你在将来处理数据分析项目时会派上用场。分析pandas数据框Profiling是帮助理解数据的过程,而Pandas Profiling 是帮助理解数据的python包,能简单快速地对Pandas数据框进行探索性数据分析。P...原创 2019-07-27 18:08:35 · 1897 阅读 · 1 评论 -
一文教你全面掌握用Python实现线性回归
全文共4968字,预计学习时长15分钟或更长本文旨在为读者理解和应用线性回归时提供参考。虽然线性回归算法很简单,但是只有少数人能真正理解其基本原则。本文首先会深入挖掘线性回归理论,理解其内在的工作机制,然后利用Python实现该算法,为商业问题建模。理论线性回归或许是学习统计学最简单的方法。在学习更高级的方法之前,这是一个很好的入门方法。事实上,许多更高级的方法可被视为线性回归的延伸。因...原创 2019-07-27 17:53:55 · 1553 阅读 · 0 评论 -
企业如今最流行什么?Spark NLP必须有姓名
全文共3103字,预计学习时长6分钟图片来源:unsplash.com/@frrnSpark NLP库已成为一种流行的AI框架,可为项目提供速度和可扩展性。人工智能在企业中的应用2019年,O'Reilly发布了《人工智能在企业中的应用》年度报告。该项报告针对多个垂直行业的1300名从业人员进行了调查,向受访者询问他们的企业在生产中有哪些能带来收入的AI项目。该报告对当...原创 2019-07-26 14:39:26 · 743 阅读 · 0 评论 -
改进机器学习模型,怎么少的了主动学习?!
全文共2059字,预计学习时长4分钟图片来源:pexels.com/@pixabay本文将阐述如何通过主动学习迭代改善机器学习模型的性能。这项技能适用于任何模型,但是本文将对主动学习如何改进二进制文本分类器进行说明。以下所有内容基于微软2018年Strata数据会议教程《将R和Python用于可扩展的数据科学、机器学习和人工智能》。代码传送门:https://github.com/...原创 2019-07-26 14:39:35 · 817 阅读 · 0 评论 -
数据科学热潮下的冷思考:什么才是最需要的技能?
全文共3087字,预计学习时长6分钟图片来源:pexels.com/@freestocks数据科学已经进入了稳定生产的成熟期,数据科学家所需的技能也在与时俱进。不仅是追求更高效的机器学习模型,在当下,推动数据科学与商业结合、促进二者的化学反应比以往都重要。在DataIku于德国柏林举办的“数据分析学和数据科学”论坛上,业内人士针对当下“有利于定义并建立创造价值的工作流的技能”这一问...原创 2019-07-23 16:50:10 · 1200 阅读 · 0 评论 -
最先进模型指南:NLP中的Transformers如何运作?
全文共5257字,预计学习时长11分钟或更长通过阅读本篇文章,你将理解:· NLP中的Transformer模型真正改变了处理文本数据的方式。· Transformer支持NLP的最新变化,包括谷歌的BERT。· 了解Transformer的运作规律,如何进行语言建模、序列到序列建模以及如何构建Google的BERT模型。下面,我们开始学习吧!图片来源:pexels/D...原创 2019-07-25 11:23:46 · 902 阅读 · 0 评论 -
视觉化呈现数据,MatPlotLib是怎么大显身手的?
全文共6661字,预计学习时长20分钟或更长图片来源:pexels.com/@divinetechygirl在现代数字世界中,数据就像空气一样重要。人们每天都会自觉或不自觉地消费和产生大量数据。近来,许多商家试图利用这些数据来进行营销和吸引消费者。所有行业都开始在其服务中增添人性化色彩,向消费者兜售绝佳的用户体验。而这一切都是基于数据科学下人工智能和机器学习技术的发展。机器正变...原创 2019-07-24 17:20:40 · 3045 阅读 · 2 评论 -
机器学习中内核的秘密:著名案例教你构建它!
全文共1576字,预计学习时长3分钟内核是映射空间中两个向量之间的相似性度量(关于内核的详细情况,请参考文末链接)。本文将带你了解一些有名的内核,以及如何组合它们生成其他内核。注意:在本文的例子中,为达到绘图目的,x’是一维的向量,并且把x ’的值固定为2。线性核这个内核的超参数是标准差和偏移量参数c。直观地讲,这个内核是什么意思?如果取一个特定的x并将它与所有其他...原创 2019-07-22 16:38:43 · 1087 阅读 · 0 评论 -
物联网的最大瓶颈,交给5G+区块链解决吧!
全文共1722字,预计学习时长3分钟图片来源:pexels.com/@rawpixel5G和区块链是两种潜在的颠覆性技术,会塑造科技和电信的未来。预计到2020年,5G将覆盖全球。那么,5G技术加区块链,未来的世界会有什么改变呢?5G、区块链与物联网设备相连接,能为社会增添巨大价值。本文将简要介绍这些技术的好处、展现的可能性,以及必须要克服的挑战。当物联网遇上5G技术和区块链...原创 2019-07-22 16:40:48 · 4321 阅读 · 2 评论 -
想改善深层神经网络,这几种途径值得一试!
全文共2734字,预计学习时长5分钟深层神经网络可以解决诸如自然语言处理、机器视觉、语音合成等复杂任务。提高深层神经网络的性能与理解其工作原理同样重要。这篇文章将解释改善神经网络方面的各种术语和方法。偏差与方差偏差与方差是体现网络在训练集和测试集中性能的两个基本术语。下列两类问题可以轻松直观地解释偏差与方差。蓝线表示由神经网络计算的判定边界。1. 最左侧的图片展示出神...原创 2019-07-23 16:53:19 · 2116 阅读 · 4 评论