使用 Python 进行马尔可夫链职业路径建模

      欢迎来到雲闪世界从职业角度来说,我是个非常奇怪的人:我在一家初创公司担任软件/机器学习工程师,拥有物理学硕士学位,即将为航空航天和机械工程博士学位论文答辩。在我不断变化的职业生涯中,有两件事始终不变:我对科学的热爱和对编程的热情。

将科学与编码相结合的一种绝妙方法是进行建模。我的意思是,为了描述世界,您需要根据某种程度的现实近似做出合理的假设。基于此假设和您的起始近似,我们可以模拟给定的过程。模拟将为我们提供一些源自原始假设但在模拟之前无法准确预测的结果。

例如,假设我们想算出一个栅栏里能容纳多少头牛。物理学家会做出一个相当奇怪的假设:

“让我们想象一下一头方形的牛”

意思是,我们把牛的形状近似为正方形。然后我们把栅栏近似为一个更大的正方形(这个假设更合理)。

现在,让我们给问题加点盐,假设奶牛的长度是随机的这意味着每头奶牛的正方形大小都是不一样的,每个正方形长度的分布是高斯分布的结果,平均值 = 2,方差 = 1。我们假设栅栏很大,L = 10。

为了解决这个问题,我们必须进行非常简单的蒙特卡罗模拟。我们不断在 10x10 的方形围栏内添加方形奶牛,看看我们是否遇到了问题,因为我们无法继续添加它们。我们重复这个过程 N=1000 次,并提取奶牛数量的平均值。

现在,很明显,这是一种计算围栏中可以容纳多少头牛的粗略方法,这实际上是物理学界的一个著名笑话。尽管如此,它完美地描述了建模的方法。
现在我喜欢人工智能。我每天都在研究和从事人工智能工作,从 2019 年开始我就一直这样做。不过,我确实不同意人工智能的一件事是,由于有了人工智能,我们不再需要建模了。我们可以训练一个机器学习模型。
这是错误的(也有点可悲)。我们需要建模,因为建模是理解我们周围世界的基础。

希望通过一些方形的奶牛和同情心,我能说服你,建模很酷。

在这篇博文中,我将使用一种非常强大的建模工具,即马尔可夫链,来模拟个人的职业 发展。我们将从刚毕业的人开始,并对他们未来将做什么给出一些概率假设。通过将这些假设代入马尔可夫链模型,我们将得到个人职业结果的分布。让我们开始吧!

0. 马尔可夫链介绍

如果你们中的一些人已经阅读了我的一些文章(谢谢,我爱你,你是最棒的❤),你们已经知道我喜欢马尔可夫链。如果你熟悉马尔可夫链,你可以放心地跳过这部分。

如果您不熟悉马尔可夫链,在本文中,我将概括地讨论它们,并且以我的拙见,对于以前从未听说过马尔可夫链并想了解其要点的人来说,这是一个很好的指南。

说实话,我们不需要为这篇博文了解很多马尔可夫链,因为它的代码量很大,但理论量不大,所以我只会非常快速地描述它的工作原理。为简洁起见,我将以职业发展为例来准确描述这一点。

让我们考虑一个随机事件E。此事件可能发生在时间 t=0、t=1、t=n。在每个时间(1 到 n),事件可以假设不同的值。例如,在 t=2(即 2 年)之后,该人可能正在攻读学士学位。我们用数学表达式将其写成:

图片来自作者

现在,假设某人在第 2 年攻读学士学位,那么 5 年后该人仍在学习的概率是多少?马尔可夫链假设告诉我们,为了知道这一点,只需要知道前一年发生了什么,例如以下表达式:

告诉我们,如果一个人在第一年攻读学士学位,那么他们继续攻读学士学位的可能性会相当高(0.8)。

我们可以在第 3、4、5 年后做同样的事情,只需考虑第 2、3 和 4 年发生的事件。因此,我们称之为

现在,这并不是特别有趣,但我们可以问自己:10 年后这个人就业的概率是多少这将是在时间 t=10 时所有其他事件(拥有学士学位的人、拥有硕士学位的人、没有学士学位的人等)的总和(加起来)。

这将是我们模拟的核心。

1. 我们的模拟假设

为了这个案例研究,我创建了一个可能的职业选择列表,考虑到刚高中毕业的人的起点。

此人可以:

  • 根本不
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值