投简历申请数据科学岗石沉大海?这些秘密别人不会告诉你

又到一年一度的毕业求职季和跳槽季。大学生们即将依依不舍地告别母校和同窗,准备迎接来自社会的机遇和挑战;职场人也开始跃跃欲试寻求更好的工作机会。前方似乎充满了无限可能对不对?但是,作为经历过毕业季的“老人”来讲,深知求职的过程其实比很多人想象的更为艰难,更为复杂。作者Edouard Harris 为那些想申请数据科学职位的小伙伴们提供了一套求职秘笈,希望能对你有所帮助。

我是一名物理学家,在 YC 创业公司工作,由于我们公司的性质,因此我收到了很多电子邮件,请求我提供一些有关数据科学职业的建议。

在这些邮件中,其中有好几封问我的问题都非常类似。随着时间的推移,对于那些经常提到的问题,我已经准备好了一些现成的答案。

就在几天前,我收到一封电子邮件,询问我在一封邮件中通常都会提到的大部分问题。我写下答案并回信了,但是后来,我意识到,是时候为那些找不到数据科学职位、却不明白个中缘由的求职者们扩展我的答案并公开发布了,现在就是很好的机会。

对于每个有疑问并提出问题的人来说,有十个人有同样的问题,但并不会去问。如果你是这十个人中的一个,那么这篇文章就是为你这种人而写的。希望这篇文章对你有所帮助。

下面是我收到的那封邮件,针对邮件长度做过删减:

电子邮件

发件人:Lonnie (化名)

主题:我想找份数据科学的工作

我是一名大学辍学生(我之所以这么说,因为很明显,如果你没有理论物理学博士学位和 15 年的数据科学经验,那一定是出了什么问题。),[……] 当我在市场营销中徘徊时,我发现我最喜欢的还是数据部分。最初,我熟悉了 A/B 测试,后来获得了 Google 的 Google Analytics \u0026amp; Optimizely 测试平台的认证。然后我开始学习 Python、SQL 等语言。我刚从一家著名的数据科学训练营毕业,但我甚至很难得到面试机会。我都已经发出了 100 多份求职申请(甚至包括其他城市),但面试机会仍然非常少。

为了提高技能,我正在攻读优达学城纳米学位(Udacity NanoDegree)和 DataQuest 线上课程。

如果您想看的话,您可以访问我的 LinkedIn:https://www.linkedin.com/in//

[…]

我觉得就是由于缺乏学术背景,才让我备受痛苦。这并不是什么真正的技能(尽管他们真的需要很多工作,而我正这样做)。我甚至都没有得到面试机会来展示我的技能。所以,我才这么说。

我在某家大公司有过一次面试,由于那是我第一次现场编写代码(或白板面试),结果不太顺利。

我从另一家大型初创公司带回了一个面试作业,那是一份生存分析报告,但我没有好好研究过,所以做得也不是很好。

我完成了另一家大公司的面试作业并赢得了面试机会,但因为我的教育背景最终还是失败了(这点很愚蠢,因为他们手上已经有了我的简历)。

除此之外,就啥都没有了。[1]

我的答复

Lonnie,你好,感谢你的信任。

这是一个事实:只有 2~3% 的面试率可能是正常的,这要取决于你在哪里提交工作申请。有两个原因,而你并不清楚其中缘由。

消失于人海

第一个原因是,大多数招聘团队使用一种叫做“求职跟踪系统”(applicant tracking system)的系统来告诉他们最优秀的求职者来自哪里。如果你正是通过这样的渠道来求职,而这个渠道以前给他们留下了不好的印象,这样,他们就不会花更多的时间来看你的求职申请。[2]

\"image\"

你的工作申请很可能是由像这样的求职跟踪系统来处理。

比如说,如果你想通过 Indeed 申请技术方面的工作,实际上,你不太可能会得到任何职位。因为每个人都知道这个方法,而且这个方法很容易。这意味着,申请工作的普通人,很可能确实就是个普通人。因此,招聘经理不会耗费太多时间去看来自 Indeed 的简历,因为在她的印象中,这些都是很普通的简历。

为了解决这一问题,你可以通过在大多数人还不知道的网站来申请职位。Key Values(https://www.keyvalues.com)和 Y Combinator 公司的“在初创公司工作”的页面(https://www.workatastartup.com)就是很好的起点。[3] 通过使用大多数人还不知道的网站,你将自己标榜为有心寻找机会的人。在这类网站申请工作的普通人,多半都在平均水平之上。这就是为什么公司更加关注通过鲜为人知的渠道申请职位的求职者的原因。

办公室政治

第二个原因是,在普通的求职网站申请工作效果并不太好。你可能很难相信这一点,但是实际上,在这些求职网站发布职位的很多公司,尤其是大型公司,实际上并没有打算这样来找到他们想招聘的人。[4]

\"image\"

如果你真的这样来寻找一个技术职位的话,那么你就大错特错了,很抱歉,确实就是这样的。

这听起来很疯狂,那他们到底为什么要在招聘网站上发帖呢?你需要了解的是,在大多数公司中,人力资源团队(HR)和工程师之间存在严重的分歧。而发布招聘信息的通常就是人力资源团队。

不幸的是,人力资源部门并没有工程师,所以他们无法确定哪些候选人真正有才华,哪些人没有。人力资源部只知道如何筛选证书,这意味着检查你是否上过一所好学校(如斯坦福大学认为你足够优秀,可以入学)或在一家好公司工作过(如 Google 认为你足够优秀,可以入职)。

所以,这就是黑暗内幕:为什么你的命中率只有 2~3%。因为人力资源部无法区分训练营的好坏。因此,他们不得不默认地说:“No!”因为他们不想浪费工程师团队的时间来寻找那些可能没有任何好处的训练营毕业生,这种事我见多了。

幸运的是,有一个好消息:大多数工程师团队都明白他们的人力资源部门无法筛选人才。因此,最好的工程团队是通过网络和特殊渠道而不是招聘网站来找到人才的。因此,我给你最好的建议是:开始将自己融入由工程师驱动的机器学习会议。这里并没有什么魔法:你只需找到相关的会议,然后就开始去参与。

你很快就会发现哪些是有价值的,哪些是没有价值的。人际关系网的好处是多方面的,所以要问一些聪明的问题,试着进行有意义的对话,并在人们自我介绍时留意那些“我们正在招聘”的公告信息。

面试

简单地说,面试就是一种黑暗的、神秘的仪式。每个公司的面试流程都不同,每个公司都认为自己的面试才是“真正的面试”。

有很多方法可以让你在面试环节中表现得更好,但最好的方法是多做、多尝试。因此,我建议你多去参加面试,这也会对你有所帮助:你参加的面试越多,你就会表现得更好。就算你的第一次面试失败了,这也是一项和其他技能一样的技能,你会在前进的途中得到它。

最后,我很遗憾这个系统破坏得这么厉害。我知道这对菜鸟来说特别难,这确实是不公平的,但要相信:隧道尽头有光明。当你有了一两年的经验之后,公司就会开始追着你。这种奖励,是值得你为此付出汗水的。

[1] 在一封后续的电邮中,Lonnie 告诉我,他不认为训练营是受挫的原因,问题在于他没有受过多少正规教育。

[2] 求职跟踪系统还可以根据关键词自动筛选出简历。但我发现大多数人已经知道在简历中包含正确的关键词,因此我不再赘述。

[3] 我知道,通过在这里给出这些招聘网站的链接,我确保更多的人知道它们。但是在不久的将来,这两家网站都不大可能会达到如此大的规模。

[4] 当然,有些人是这样做的,甚至是那些有时偶然找到好的候选人。但如果你就是这样的求职者,那就把这些公司当做意外惊喜吧!

原文链接:
https://towardsdatascience.com/what-no-one-will-tell-you-about-data-science-job-applications-bff2d4b5e983

更多内容,请关注AI前线

\"image\"

【电力系统】单机无穷大电力系统短路故障暂态稳定Simulink仿真(带说明文档)内容概要:本文档围绕“单机无穷大电力系统短路故障暂态稳定Simulink仿真”展开,提供了完整的仿真模型与说明文档,重点研究电力系统在发生短路故障后的暂态稳定性问题。通过Simulink搭建单机无穷大系统模型,模拟不同类型的短路故障(如三相短路),分析系统在故障期间及切除后的动态响应,包括发电机转子角度、转速、电压和功率等关键参数的变化,进而评估系统的暂态稳定能力。该仿真有助于理解电力系统稳定性机理,掌握暂态过程分析方法。; 适合人群:电气工程及相关专业的本科生、研究生,以及从事电力系统分析、运行与控制工作的科研人员和工程师。; 使用场景及目标:①学习电力系统暂态稳定的基本概念与分析方法;②掌握利用Simulink进行电力系统建模与仿真的技能;③研究短路故障对系统稳定性的影响及提高稳定性的措施(如故障清除时间优化);④辅助课程设计、毕业设计或科研项目中的系统仿真验证。; 阅读建议:建议结合电力系统稳定性理论知识进行学习,先理解仿真模型各模块的功能与参数设置,再运行仿真并仔细分析输出结果,尝试改变故障类型或系统参数以观察其对稳定性的影响,从而深化对暂态稳定问题的理解。
本研究聚焦于运用MATLAB平台,将支持向量机(SVM)应用于数据预测任务,并引入粒子群优化(PSO)算法对模型的关键参数进行自动调优。该研究属于机器学习领域的典型实践,其核心在于利用SVM构建分类模型,同时借助PSO的全局搜索能力,高效确定SVM的最优超参数配置,从而显著增强模型的整体预测效能。 支持向量机作为一种经典的监督学习方法,其基本原理是通过在高维特征空间中构造一个具有最大间隔的决策边界,以实现对样本数据的分类或回归分析。该算法擅长处理小规模样本集、非线性关系以及高维度特征识别问题,其有效性源于通过核函数将原始数据映射至更高维的空间,使得原本复杂的分类问题变得线性可分。 粒子群优化算法是一种模拟鸟群社会行为的群体智能优化技术。在该算法框架下,每个潜在解被视作一个“粒子”,粒子群在解空间中协同搜索,通过不断迭代更新自身速度与位置,并参考个体历史最优解和群体全局最优解的信息,逐步逼近问题的最优解。在本应用中,PSO被专门用于搜寻SVM中影响模型性能的两个关键参数——正则化参数C与核函数参数γ的最优组合。 项目所提供的实现代码涵盖了从数据加载、预处理(如标准化处理)、基础SVM模型构建到PSO优化流程的完整步骤。优化过程会针对不同的核函数(例如线性核、多项式核及径向基函数核等)进行参数寻优,并系统评估优化前后模型性能的差异。性能对比通常基于准确率、精确率、召回率及F1分数等多项分类指标展开,从而定量验证PSO算法在提升SVM模型分类能力方面的实际效果。 本研究通过一个具体的MATLAB实现案例,旨在演示如何将全局优化算法与机器学习模型相结合,以解决模型参数选择这一关键问题。通过此实践,研究者不仅能够深入理解SVM的工作原理,还能掌握利用智能优化技术提升模型泛化性能的有效方法,这对于机器学习在实际问题中的应用具有重要的参考价值。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
【IEEE顶刊复现】水下机器人AUV路径规划和MPC模型预测控制跟踪控制(复现)(Matlab代码实现)内容概要:本文档聚焦于【IEEE顶刊复现】水下机器人AUV路径规划与MPC模型预测控制跟踪控制的研究,提供了完整的Matlab代码实现方案。内容涵盖AUV在复杂海洋环境下的路径规划算法设计与模型预测控制(MPC)的跟踪控制策略,重点复现了高水平期刊中的关键技术细节,包括动力学建模、约束处理、优化求解及控制反馈等环节。文档还附带多个相关科研方向的技术介绍与资源链接,突出其在智能控制与机器人领域的高仿真精度与学术参考价值。; 适合人群:具备一定自动化、控制理论或机器人学背景,熟悉Matlab/Simulink环境,从事科研或工程开发的研究生、高校教师及科研人员;尤其适合致力于路径规划、MPC控制、水下机器人系统开发等相关课题的研究者。; 使用场景及目标:①复现IEEE顶刊中关于AUV路径规划与MPC控制的核心算法;②深入理解MPC在非线性系统中的应用机制与优化求解过程;③为水下机器人、无人系统等方向的科研项目提供可运行的代码基础与技术参考;④辅助论文写作、项目申报与仿真验证。; 阅读建议:建议结合文档中提供的网盘资源(如YALMIP工具包、完整代码等)进行实践操作,重点关注MPC控制器的设计参数设置与路径规划算法的实现逻辑,同时可参考文中列举的其他研究方向拓展思路,提升科研效率与创新能力。
代码下载地址: https://pan.quark.cn/s/1b5b026cbb57 分类类别不平衡问题--python篇 # 一、什么是类不平衡 ## 在分类中经常会遇到:某些类别数据特别多,某类或者几类数据特别少。 如二分类中,一种类别(反例)数据特别多,另一种类别(正例)数据少的可怜。 如银行欺诈问题,客户流失问题,电力盗窃以及罕见疾病识别等都存在着数据类别不均衡的情况。 二、为什么要对类不平衡进行特殊处理 ## 传统的分类算法旨在最小化分类过程中产生的错误数量。 它们假设假阳性(实际是反例,但是错分成正例)和假阴性(实际是正例,但是错分为反例)错误的成本是相等的,因此不适合于类不平衡的数据。 有研究表明,在某些应用下,1∶35的比例就会使某些分类方法无效,甚至1∶10的比例也会使某些分类方法无效。 如果数据存在严重的不平衡,预测得出的结论往往也是有偏的,即分类结果会偏向于较多观测的类。 三、提升不平衡类分类准确率的方法 ## 提升不平衡类分类准确率的方法有三大类:采样、阈值移动、调整代价或权重。 avatar 1、采样 ### 1 过采样 #### 过采样基本思想就是通过改变训练数据的分布来消除或减小数据的不平衡。 过采样有随机过采样、基于聚类的过采样、信息性过采样(SMOTE)三大类方法。 随机过采样:通过增加少数类样本来提高少数类的分类性能 ,最简单的办法是随机复制少数类样本。 基于聚类的过采样:K-Means聚类算法独立地被用于少数和多数类实例,之后,每个聚类都过采样使得相同类的所有聚类有着同样的实例数量。 avatar 信息性过采样--SMOTE 利用KNN技术,对于少数类样本a, 随机选择一个最近邻的样本b, 然后从a与b的连线上随机选取一个点c作为新的...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值