在我加入 LinkedIn 之前,我是如何成为一名数据科学家的

原文:towardsdatascience.com/how-i-became-a-data-scientist-before-i-joined-linkedin-e3b8e4816001

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/2328bb102ddd64eca473f7dbe95d830b.png

2023 年 LinkedIn 总部同事的照片,经作者许可使用(来源

一个人如何第一次获得数据科学家的梦想工作?

我的梦想工作是在 LinkedIn 从事数据科学工作。

然而,我既没有正式的数据科学教育,也没有之前的数据科学家职位。当时数据科学是一个新兴的新领域。它不像现在这样在学校里普遍教授,也不像现在这样在大多数公司中可用。

在我被 LinkedIn 雇佣之前,我仍需要证明我能完成所需的工作。

我很感激最终被 LinkedIn 雇佣。后来,我成为了一个由 14 名数据科学家组成的数据科学团队的负责人,负责为我们数十亿美元的在线广告业务获取和增长客户。

我将与你分享我是如何开始从事数据科学的。

为职业转型做好准备

如果你不是已经在作为数据科学家工作,那么获得第一份数据科学家工作是有挑战性的。也许你即将从学校毕业。也许你已经在工程师、财务分析师或科研人员等职位上工作了一段时间,但想要转型到数据科学领域。

额外的挑战是,职业道路不再是一条线性的路径。你可以预期每隔几年就刷新一下你的职业和技能。事实上,世界经济论坛引用了美国劳工统计局的数据,称美国成年人到 55 岁时平均有12 份工作。世界经济论坛 2023 年《就业未来报告》也预测,未来 5 年内,44%的工人核心技能预计将发生变化,其中增长最快的职业将包括人工智能和数据分析方面的数据技能。

当我调查我的 LinkedIn 网络时,只有 50%的受访者表示他们正在从事与他们的学术专业直接相关的职业。我所知道的数据科学家,甚至我雇佣的数据科学家,都像我一样,从不同的学术和专业背景开始。是的,人们可以追求并成功地进行职业转型!

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c0be3ab96125b8dcdf16e716592c2630.png

2023 年 5 月作者的 LinkedIn 调查结果

职业转型需要真实的生活经验

我指导并辅导的人经常问我:“吉米,你是如何成为数据科学家的?”

他们看到我并非一开始就是数据科学家,但最终成为了 LinkedIn 数据科学团队的经理。他们想知道是什么让我能够将我的职业生涯转型为数据科学。他们自己也在寻找将职业生涯转型为数据科学或人工智能角色的方法。

为了获得这些职业机会,我建议人们首先需要以下三个基本要素,每个专业人士都应该投资于他们的职业生涯,无论是数据科学还是其他领域:

  • 技能:作为一个 T 形或π形专业人士,展示所需的技术和非技术技能 [了解更多]

  • 网络:建立一个强大的人脉网络,这些人可以帮助你获取信息、资源以及介绍新的机会 [了解更多]

  • 专业品牌:建立你的声誉,让人们信任你 [了解更多]

培养上述个人资产将帮助任何人的职业生涯准备好增长和转型。

对于数据科学、人工智能或其他技术领域的职位,人们还需要展示成功的项目来赢得雇主的信任。仅仅阅读关于数据科学的内容是不够的,但有志于成为数据科学家的人也需要在数据科学方面展示真实的实践经验。

如何获得数据科学实践经验

如果你还不是数据科学家,那么你需要以任何可能的方式完成一个有意义的数据科学项目。以下有三个想法:

  1. 志愿参与数据科学工作。例如,可以查看“无国界统计”小组,该小组协调志愿者与非营利性非政府组织在数据项目上的合作。

  2. 完成你的实习、学校的商业咨询项目或特殊的数据科学“速成班”项目。获取与真实生活杂乱数据工作和与真实商业利益相关者互动的经验。

  3. 在你当前雇主处提出并完成一个数据科学项目。例如,我曾经赞助一位人力资源分析师在我的数据科学团队中开展一个辅助项目,以便她获得一些实践经验,类似于工作实习。

对于我自己的数据科学初阶转型,我很幸运能够使用前一个雇主提供的第三个选择。

在之前的公司,我有机会探索和提出新的项目。我正在从数据仓库和商业智能团队的经理角色转型,在那里我已经学习了 SQL、Python 和 Linux。尽管我对数据科学很感兴趣,但当时公司还没有完全准备好进行数据科学。

然而,我仍然能够在那里提出并完成两个试点数据科学项目,这为我提供了至关重要的学习机会。

我的第一个数据科学项目:销售数据

我记得我的第一个数据科学项目是分类非洲的销售订单。

我们公司在全球范围内使用在线 ERP 订单交易系统记录客户销售订单。其中一些销售订单是直接销售给客户的,应该为我们的内部销售团队记信用。然而,其他非洲销售订单应该通过外部渠道销售合作伙伴,这意味着销售应该为外部合作伙伴记信用。

这些内部和外部销售人员依赖于准确的数据来获得准确的销售补偿。

不幸的是,公司没有一种方法可以将正确的销售信用记录到 ERP 数据库中。我不记得为什么。技术-功能业务系统分析师无法开发一个记录外部渠道合作伙伴正确销售信用的流程。业务无法描述用于分类销售订单的必要的一致规则。

解决方案是销售团队需要审查每份进入的销售订单,然后手动分类是内部销售代表还是外部渠道合作伙伴应该获得销售佣金。

没有人喜欢做手动数据分类的工作。

销售总监听说了我的声誉后,向我寻求解决方案。

提议的数据科学技术

当我听到这个业务问题时,我立刻觉得这可能是一个可以用数据科学分类模型解决的问题。

那时数据科学对我来说和公司都是新的。公司里没有人做任何数据科学。为了跟上行业趋势,我至少对其他业务中数据科学家使用的技巧有所了解。

我向销售总监提出了我的计划。由于他不是技术人员,我简单地告诉他,我将建立一个方法来“预测”每个销售订单应该如何分类以获得销售信用。他等待着我能提供什么。

当时我们没有任何数据挖掘工具。我最终研究了并决定使用来自斯洛文尼亚卢布尔雅那大学的免费Orange 数据挖掘软件。作为一个数据科学新手,我欣赏这个软件拥有丰富的 Windows 图形界面,可以通过拖放界面构建数据挖掘和机器学习的数据管道。

软件的早期版本有时会有 bug,当数据集大小变得太大时,GUI 在我的 Windows 电脑上会崩溃。然而,我深情地记得,这款软件是我学习不同数据科学和机器学习技术的入门点。

这款免费软件可以执行各种数据科学任务。它可以进行探索性数据分析、分类和回归。它可以进行无监督学习,包括层次聚类和 k-Means 聚类。它可以运行不同的算法,包括朴素贝叶斯、SVM、kNN 和神经网络。

Orange 是一个免费的无代码数据挖掘系统,非常适合我最初的数据科学实践。

销售成功的解决方案

使用该软件,我发现我能够构建一个具有合理准确性的预测模型来分类销售订单。

对于训练集,我使用了来自手动分类的历史数据。数据特征全部来自销售订单记录。我最终选择了 SVM 算法来为这个业务案例构建最佳模型。我通过构建一个 Python 脚本来实现数据管道的模型化,包括使用新数据对模型进行增量重新训练。

此外,我为销售团队构建了一个基于 Python 的 Web 应用程序,以确认预测的销售渠道合作伙伴销售订单,并审查任何预测分数边缘的记录。销售团队的新确认被反馈到 SVM 模型中,作为闭环反馈,随着时间的推移提高了模型精度。

销售总监对结果表示满意。

公司的第一个数据科学项目节省了他的团队仔细审查每个新到销售订单的时间。我很高兴看到数据科学技术确实有效。数据科学和人工智能可以为商业中的体力劳动提供捷径

随后,销售总监为我写了一份推荐信,这对从未来的雇主那里获得信任很有帮助。

我的第二个数据科学项目:员工数据

在那个销售分类项目之后,我在公司又进行了一个数据科学项目,使用内部可用的员工目录数据来预测员工流失。

我监控了几个月模型预测的结果,并对模型预测员工流失的能力感到鼓舞。

我与公司领导分享了结果,但遗憾的是,这些结果对业务来说不可操作。我们无法干预模型预测将离职的员工。

这些是我后来在向公司人力资源部门的人事分析职能中的数据科学家提供建议时借鉴的一些经验。

保持敏捷以适应职业转变

我从这两个早期的数据科学项目中获得了宝贵的经验。我很感激在之前的公司有机会提出并完成这些项目,尽管当时我还没有正式成为数据科学家。

这些数据科学项目经验对我后来成功面试 LinkedIn 商业分析(数据科学)团队至关重要。

对于有兴趣转向数据科学或 AI 角色的人来说,找到任何完成成功数据科学项目的方法。为了进入一个新的领域或行业,你需要建立信任,证明你已经拥有了那个理想工作的所需经验。

我不仅从自己的职业旅程中学到了东西,也从那些我指导过的人那里学到了。在一个工作场所变化如此之快的世界上,我确实看到人们采取步骤成功地转向新的职业,就像我一样,无论是数据科学还是其他领域。在所有情况下,保持持续学习和敏捷性以为你的职业生涯提供保障都是至关重要的。

喜欢这个故事吗?

关注我,当我有新故事发布时会收到通知:在 Medium 上免费订阅

每当 Jimmy Wong 发布内容时,都会收到电子邮件。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值