Python 最火,R 极具潜力:2017 机器学习调查报告

Kaggle发布2017年机器学习及数据科学调查报告,涵盖编程语言偏好、数据科学家年龄分布、平均薪资水平等内容。Python成为主流编程语言,R语言在统计学家群体中更受欢迎。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(点击上方蓝字,快速关注我们)

转自:开源中国

数据平台 Kaggle 近日发布了 2017 机器学习及数据科学调查报告,这也是 Kaggle 首次进行全行业调查。调查共收到超过 16000 份回复,受访内容包括最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等。

报告主要内容概括如下:

  • 在机器学习领域,虽然 Python 很可能是最常用的编程语言,但统计学家更多地是使用 R 语言。

  • 平数据科学家的年龄平均在 30 岁左右,但是这个数字在因国家不同而存在差异。如,印度的受访者平均比澳大利亚的年轻 9 岁。

  • 在被调查者中,硕士学位的获取比例较高,但工资最高的($150k+)人群中,博士学位的拥有者比较多

接下来,我们与大家共同探索机器学习方面的调查结果。

下面主要看看工具使用方面的结果。请注意,该报告包含多个国家的数据,可能存在收集不够全面的情况,仅供参考。

年龄

从全球范围来看,本次调查对象的平均年龄在 30 岁左右。当然,各个国家的数值会有差异,中国的机器学习从业者年龄的中位数是 25 岁。

640?wx_fmt=png

目前就业状况

全球全职工作者为 65.7% ,其中中国为 53.% ,美国占比较高,达 70.9% 。

640?wx_fmt=png

从事职业

Logistic 回归是除了军事和国安领域外,最常用的数据科学研究方法。在军事和国防安全领域,神经网络被使用更多。

640?wx_fmt=png

工作内容

Logistic 回归是除了军事和国安领域外,最常用的数据科学研究方法。在军事和国防安全领域,神经网络被使用更多。

640?wx_fmt=png

工作中使用最多的语言

在工具语言使用方面,Python是数据科学家使用最多的语言。同时,统计学家对 R 语言的忠诚度很高。

640?wx_fmt=png

工作中最常用的数据类型

关系型数据是最常用的数据类型,学术研究者和国防安全领域则更亲睐文本和图像。

640?wx_fmt=png

代码分享方式

Git 是他们最常用的代码共享和托管方式。

640?wx_fmt=png

工作主要障碍

Dirty Data (脏数据)是从业者遇到的最大障碍。此外,理解不同算法的能力不够也是困扰数据工作者的一大障碍。缺乏有效管理和资金支持,是面临的两大外在困境。

640?wx_fmt=png

新手如何入行

当进入一个新的职业领域时,可以听听别人的成功秘诀。

首选语言

有趣的是,只使用 Python 或只使用 R 的都觉得他们做出了正确的选择。 但是,如果你去询问那些既使用 Python 也使用 R 的人,推荐使用 Python 的可能会是 R 的两倍。

640?wx_fmt=png

数据科学学习资源的选择

数据科学是个变化极快的领域,业内人员需要不断更新知识体系,才可以在业内保持一定地位,不被时代淘汰。Stack Overflow Q&A、Conferences 和 Podcasts 是已从业者经常使用的学习平台。

640?wx_fmt=png

更多内容请查看:https://www.kaggle.com/surveys/2017

觉得这条资讯有帮助?请转发给更多人

关注 技术最前线 看 IT 要闻

640?wx_fmt=png

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值