如果你……不要成为数据科学家

原文:towardsdatascience.com/dont-be-a-data-scientist-if-you-98764ae37bc0

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3047edbd5c2cd5caf8fc711149d55cd9.png

图片由Tech NickUnsplash提供

如果你……不要成为数据科学家

从我关闭与我一起阅读系列已经有段时间了。在这段时间里,我在中国与父母庆祝了春节,并与我的经理进行了年中绩效评估。虽然我用视频记录了我在中国的经历,但我还没有整理我从绩效评估中得到的反馈,这将是一个很好的机会在本文中分享。毕竟,随着几周的工作纪念日过去,我已经到了一个很好的反思我在路上所学到的时刻。尽管标题可能看起来像点击诱饵,但它是我迄今为止旅程的总结。


不要成为数据科学家——如果你没有成长型思维

在职业生涯的早期阶段,出现冒名顶替综合症是非常常见的——我们常常怀疑自己是否有资格得到这份工作。在科技行业中,这种现象尤为普遍,因为这是一个快速发展的领域。去年使用的某些算法可能已经过时。每个人都追逐最新的热门词汇,这给寻找工作和在职的人带来了很多压力。

没有成长型思维,就无法摆脱这种不配感。成长型思维相信通过努力、学习和坚持不懈,随着时间的推移,人们能够发展和提高智力。这与固定型思维相反,固定型思维认为能力和智力是先天的、不可改变的特质。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/b83b6c6ff0f452adbf05e964db79dfbc.png

图片由Miquel PareraUnsplash提供

具有成长型思维的人更有可能接受挑战,面对挫折时坚持不懈,将努力视为掌握的途径,并从批评中学习。

我发现的一个保持成长型思维的有用技巧是“假装直到你做到”。我可能不是非常擅长做 A 或利用 B,但我相信我可以通过自学、向他人学习以及练习,在将来掌握它。

持续学习:数据科学家的奥德赛

成长心态全部在于对新事物的开放,比如新想法、算法和技术。这并不意味着我们必须因为它们看起来过时而放弃旧的方法。然而,这意味着我们需要愿意接受变化并学习新事物。我们应该客观地评估它们,以确定它们是否适用于我们目前正在从事的工作。

需要记住的一个重要的事情是,你不必在所有事情上都有知识。相反,最好专注于一个或几个领域,并学习如何利用他人的专业知识。理解如何协作和委派任务是优化团队效率的关键。

最后,记得通过提供适合你的指导和建议来回报社会。虽然我们常常通过自己艰难的方式学习到重要的生活教训,但我发现帮助他人避免我过去犯过的错误非常令人满意。这也是我继续在 Medium 上写作的原因之一。

我的博客文章画廊


不要成为数据科学家——如果你不关心业务影响

我从我的绩效评估中收到的一条反馈是关于我对业务的当前理解差距。如果我将自己与在公司工作多年的不同组织的人进行比较,我发现他们在识别洞察力和发现不准确之处方面具有优势,即使我们在审查相同的数据集。我称之为数据感知,这是除了只关注可交付成果之外,我需要积极学习和掌握的东西。

如果你没有关于数据是如何收集以及为什么以这种方式收集的任何背景信息,几乎不可能理解数据。你只能通过沉浸于业务运作以及基于你发现的洞察力可以得出的影响来回答这些问题。

作为一名新人或在职业生涯的早期阶段,更关注“分配给我的任务是什么”和“如何完成它”而不是“为什么我被分配这个任务”是很常见的。当你开始质疑你为什么要执行一项任务时,你就从一名机械和无情的工人提升为一名有经验的人,他理解推动业务价值的重要性。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5a44e0a078bbbd6e1f4b355cf20e7c20.png

Jakub ŻerdzickiUnsplash上的照片

向利益相关者或管理层展示你的模型结果总是具有挑战性,尤其是如果你需要为非技术受众弥合技术差距时。提前了解你工作的目的是帮助你预测利益相关者可能提出的问题。你的工作应该旨在减轻他们的痛点;关键是有效地传达这一点。

另一个常见的挑战发生在面对工作中对您的怀疑和不信任时。当解释您所做的工作以及它是如何帮助解决利益相关者关注的问题时,您会耐心且不满足于现状吗?虽然您应该紧紧抓住关于数据及其算法正确性的核心信念,但也要保持开放的心态,因为您在这里是为了解决问题和产生商业影响。

正如我在上一篇文章中提到的,数据使我们可信,但故事使我们难忘。即使您运行最复杂的模型并构建最花哨的仪表板,利益相关者也总是可以问您,那又如何呢?没有什么比一个能够解释原因并教给他们如何做的引人入胜的故事更有说服力,这也是我需要改进的领域。

数据告诉我们“是什么”,而我们总是寻求“为什么”

想了解更多关于产生商业影响和工作场所沟通的内容,请查看我最新的视频:

cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FQjWp7j0u6v4%3Ffeature%3Doembed&display_name=YouTube&url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DQjWp7j0u6v4&image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FQjWp7j0u6v4%2Fhqdefault.jpg&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=youtube


不要成为数据科学家——如果你不喜欢“脏活”

许多有抱负的数据科学家进入这个领域,期待着“构建模型”。这与我们在学校或从教程中学到的东西一致,我们被给予一个干净的数据集(Iris.csv)并尝试不同的模型,看看哪个模型在常见的指标上表现最好。

然而,构建和微调模型只占我时间的一半。在构建模型之前,理解、检查和清理数据是至关重要的。我有一篇文章总结了这个过程的一般实践:

“垃圾输入,垃圾输出”在解决实际商业问题中是什么意思?

然而,有许多需要关注的模糊性。面对数千个特征,几乎不可能一次性理解所有内容。我发现的一个好做法是根据它们的企业意义将这些特征分类成子组,并花时间理解每个组的不同之处。

例如,即使在数据集中,像价格这样的简单、易懂的特征也可能出人意料地复杂。与价格相关的数据类型有很多,例如单价、总销售额、净价(即销售额减去成本)、折扣水平、折扣金额等等。

理解为什么我们需要以多种方式收集数据以及这些特征如何不同是很重要的。通过这样做,我们可以在进行价格弹性估计等分析时避免感到不知所措,因为我们知道如何为我们的需求选择适当的定价特征。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/1bf49cfdc43e5fad701e0f0b44ad8903.png

图片由 Jan Antonin KolarUnsplash 提供

即使模型创建并最终确定后,我们也不能简单地离开并转向其他项目。我们需要用清晰的故事线来传达我们的发现,以支持我们的发现。在许多情况下,我们还必须建立一个端到端的流程来提高生产力、增强可重用性,并将模型投入生产。

数据科学家的角色远不止模型构建,或简单的“清洁工作”。事实上,随着 AI 工具变得越来越复杂且易于访问,人力工人的价值来自于做“脏活”——面对模糊性的问题解决技能。

这也与之前的两个观点相一致,我们需要保持成长心态与 AI 协作并保持最新,我们需要了解业务,成为不可轻易替代的人类专家。


不要成为数据科学家——如果你不应用 80/20 法则:

最后,在科技行业中,疲劳过度是一个真实存在的问题,尤其是对于需要建立声誉但不知道从何下手的初学者来说。一开始投入更多的时间和精力,学习得足够好,并开始你的第一个项目,这是可以理解的。

然而,过度工作永远不可持续,最终会扼杀你对这个角色的热情。解决方案来自于 80/20 法则,也称为帕累托法则,它表明大约 80%的效果来自于 20%的原因。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/f1d81dc1c9029aa918e712353591f414.png

图片由 Markus SpiskeUnsplash 提供

观察你组织中的重要事项并了解你的职业目标,以确定工作中的这 20%原因需要一些时间。有了这些想法,你就会知道如何优先处理分配给你的任务,并明确地拒绝以沟通界限。

80/20 法则也适用于时间管理。无论是在工作还是生活中,都要专注于产生最大成果的活动,并将低效的任务委托或最小化。蒂莫西·费里斯的《每周工作 4 小时》解释了更多细节和实用的方法。它适用于像数据科学家这样的角色,他们不仅限于在办公室工作,这使得从任何地方交付工作成为可能。

《每周工作 4 小时:逃离朝九晚五,随时随地生活,加入新富阶层》

即使你的职业目标是保持工作与生活的平衡或每周只工作 4 小时,80/20 法则在确定攀登职业阶梯的重要事项时仍然很有用。我猜我的观点是,不要限制自己在获取新技能或工作中采取更高视角,但要知道你的界限和偏好。

例如,我倾向于避免重复性或需要手动努力的任务。如果我不能委托或避免它们,我总是尝试找到更高效工作的方法。虽然最初可能需要更多时间,但建立一套系统从长远来看可以节省更多时间。例如,如果需要运行代码超过两次,我会将其编写成函数或模块。如果需要向他人解释某事超过两次,我会创建关于它的文档、博客或视频。如果你有其他提高工作效率的好方法,请留下回复。


这是我在这两个不同公司担任这个角色超过三年后所思考的一切。

《我是如何成为数据科学家的》

总结来说,在每一个角色中,我们都应该努力成为不可替代的员工:

不要让自己成为可要可不要的人,而要成为必不可少的人

和在你的专业领域,

当你可以追求卓越时,不要满足于平庸

如果你对我的工作日作为在家工作的数据科学家感兴趣,请查看这个视频:

cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FQO7SmfmubTQ%3Ffeature%3Doembed&display_name=YouTube&url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DQO7SmfmubTQ&image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FQO7SmfmubTQ%2Fhqdefault.jpg&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=youtube

最后,别忘了:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值