揭秘数据科学:4种数据科学工作,8项求职技能


想成为一个数据科学家?很多人跟你有同样的想-托马斯·达文波特(Thomas Davenport)和DJ帕蒂尔(D.J. Patil)在哈佛商业评论上发表的一篇文章中称,“数据科学家”是21世纪最性感的工作。

但怎样才能入门呢?许多的信息可能会导致你认为成为一个数据科学家需要全面掌握一些领域的知识,如软件开发,数据结构化,数据库,统计学,机器学习和数据可视化。

不用担心。从我作为一个数据科学家的经验来说,事实并非如此。你并不需要马上学会一辈子受用的与数据相关的信息和技能。与之相反,学会仔细阅读数据科学的职位描述,这将有助于申请那些你已经拥有必要的技能的职位,或者学习特定的数据技能以适应你想要的工作。


4种数据科学工作

“数据科学家”经常是被用来形容完全不同的工作的一个总称。这里有四种类型的数据科学工作:


数据科学家是住在旧金山(San Francisco)的数据分析师:


玩笑归玩笑,其实在一些公司,数据科学家是数据分析员的代名词。你的工作可能包括从MySQL数据库中提取数据,成为Excel数据透视表的高手以及形成最基本的数据可视化(如线和条形图)。你可能偶尔分析一下A/ B测试的结果或负责公司的谷歌分析(Google Analytics) 账户。这样的公司是一个有抱负的数据科学家学习入门技术的好地方。一旦你熟悉你的日常事务,这样的公司可以为你创造一个尝试新事物和扩大新技能的环境。


请把我们的数据打包整理!:


目前很多公司所处状态是,他们有大量的流量(日益庞大的数据量),他们在找人建立能帮他们向前发展的数据基础设施,他们找人来提供数据分析。你会看到这一类型的职位被列在“数据科学家”和“数据工程师”的职位列表里。因为你是第一个(或第一批之一)数据员工,可能比较容易出成果,所以你是一个统计专家或机器学习专家并不那么重要。一个拥有软件工程背景的数据科学家可能更容易在这样的公司有突出的表现,因为对这样的公司来说,更重要的是一个数据科学家能对产品代码做出更有意义的数据类的贡献并提供基本的见解和分析。


我们就是数据,数据就是我们:


还有许多公司,他们的数据(或他们的数据分析平台)就是他们的产品。在这种情况下,数据分析或机器学习的任务就会非常繁重。这可能对一个有正式的数学,统计学或物理学背景并希望继续走一条更学术的道路的人来说是更理想的环境。数据科学家在这样的环境中可能更专注于生产大数据驱动的产品,而不是回答公司业务问题。这一类的公司可能是面向消费者的拥有海量数据的公司或者以提供数据为基础的服务的公司。


大小合理的数据驱动的非数据公司:


很多公司都属于这一类。在这类公司中,你会加入一个由数据科学家组成的团队。你面试的公司关心数据,但可能不是一个数据公司。因此,进行数据分析,了解产品性能,将数据可视化这些能力是同等重要的。一般来说,这些公司要么寻求通才,要么寻找一个能填补他们团队空缺的专才,比如数据可视化或机器学习方面的。面试这一类公司的时候,比较重要的技能是熟悉“大数据”的专用工具(例如,Hive或Pig)以及有处理杂乱无章的真实数据集的经验。


希望这能帮你了解“数据科学家”的含义是多么广泛。以上四类公司在寻求不同的技能,专长和经验水平。尽管如此,所有这些工作职位可能都是“数据科学家”,所以密切关注职位描述可以帮你了解你将加入什么样的团队以及需要哪些技术。


(未完待续)


原文链接:http://blog.udacity.com/2014/11/data-science-job-skills.html


转载请注明出处,谢谢!