全文共1910字,预计学习时长6分钟

图源:Unsplash
生活中,我们常常将核心技能与热门新兴技能弄混,今天小芯就来带你一探究竟,分清这两者。
我们将数据科学技能分为两大类:一类是大多数受访者具备的13项核心、稳定的技能;另一类是大多数人还未掌握但想要掌握的热门新兴技能。
最新的科研调查问了下面两个问题:
1. 你目前拥有哪些技能/知识(要达到可以在工作或研究中使用的水平)?
2. 你想获得或提高哪些技能?
基于过去大量的科研文章和调查数据,我们确定了30项技能,并将其做成了列表——在本文的末尾可以找到链接,以及外部来源。总而言之,这项民意调查共获得了1500多张选票——样本数量足够,可以做出有意义的推论。调查报告显示,平均每名调查对象有10项技能,并希望增加或提高6.5项技能。下面的图1展示了主要发现,X轴表示第一个调查问题的答案,即已有技能的百分比,Y轴表示第二个调查问题的答案,即需求技能的百分比。每个圆圈的大小与拥有该技能的人数比例成正比,而颜色取决于需求技能/拥有技能的比例(红色代表的比例高——大于1,蓝色代表的比例低——小于1)。
注意:其他大数据工具入口是针对除Hadoop或Spark之外的大数据工具。

图1:与数据科学相关的技能:已有技能 vs想增加或提高的技能
在该图表中,可以注意到两个主要的集群。
集群1(图1右侧的蓝色虚线框中),包含了超过40%的调查对象所拥有的技能,并且需求技能/拥有技能的比例小于1。我们把这些技能称为核心数据科学技能。表1中列出了这些核心技能。

表1:核心数据科学技能,按拥有技能的百分比递减排列
其中,最想获得或提升的技能是机器学习(41%)和Python(37%)。占比最低的技能是Excel——只有7%的人想获得或提高Excel技能。第二个集群(图1左侧的红色虚线框中),包含了当前不太流行但占比正在增长的技能(已有技能占比< 30%),需求技能/拥有技能的比例大于1——见表2。我们称这些技能为热门/新兴数据科学技能。

表2:热门/新兴数据科学技能,按需求技能/拥有技能的百分比递减排列
有趣的是,尽管有人认为Hadoop的热度正在下降,但在这次民意调查中,想学习Hadoop的人比已经掌握该技能的人多,所以这一技能可能仍会越来越热门。
尽管Julia的“需求/拥有比例”高达3.4,但只有2%的调查对象选择了它,因此,这里并没有将该技能纳入热门/新兴技能之列,因为它还没有得到足够的支持。
其他技能——如xboost、软件工程、Java、MATLAB、SAS等,有10%到30%的调查对象掌握这些技能,但占比没有增长——需求/拥有比例小于1。

表3:其他数据科学技能,按拥有技能的百分比递减排列
以下是该调查的更多细节内容。图2按拥有技能的百分比递减排列所有技能。

图2:科研文章读者拥有的数据科学技能
图3展示了读者想要掌握或提高的技能,以及他们所拥有的技能。

图3:读者想要掌握或提高的技能(红色)和拥有的技能(蓝色)
可以看出,当前有抱负的数据科学家最想要掌握的技能是深度学习、Tensorflow、机器学习和Python。调查对象还包括以下职业类型:
· 工业/个体经营,64.4%
· 政府/非营利组织,7.2%
· 学术界/大学,7.0%
· 学生,14.3%
· 其他/不适用,7.1%
区域分布:
· 美国/加拿大,37.9%
· 欧洲,28.3%
· 亚洲,19.3%
· 拉丁美洲,6.1%
· 非洲/中东,4.8%
· 其他,3.5%
该项调查从就业岗位的角度进行了初步分析,以后将根据研究技能、就业类型和地区之间的联系进行更详细的分析。
现在,你是否对自己所应该学习的东西,心底里有数了?

注意:该调查投票最初通过Google Forms发起,但遭到了恶意程序攻击,Julia和MATLAB各收到了 50,000多张无效票。后来我们剔除了恶意投票,保留了有效投票,并使用另一个平台重新发起投票,但不再包含Julia和MATLAB,以避免再被恶意程序攻击。Julia和MATLAB最终的投票结果是根据第一次投票结果中的有效票数估计出来的。

留言 点赞 关注
我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)


被折叠的 条评论
为什么被折叠?



