写在开头的 PS:
把给前公司写的文章搬运回来, 希望重启一下这个写作系列, 尤其现在入职某物流公司, 可以顺理成章尝试挖掘这个仿真工具的潜力
---------
本系列文章旨在介绍 SimPy 在工业仿真中的应用。
在物流行业/工厂制造业/餐饮服务业存在大量急需优化的场景, 例如:如何最优化快递分拣人员的排班表以满足双十一突发的快递件量
如何估算餐厅在用餐高峰的排队时长
估算特定工序下,工厂生产所需要的物料成本/人力成本/时间成本
这类场景无法通过常规算法求出最优解, 但是我们可以通过大量业务实践中总结出一些接近的次优解。
实际生产中,随时调整厂房的生产线来试验最优解是非常昂贵的。引进仿真技术,可以给业务研究员无限的自由度去调整验证不同的优化方案。仿真的成本无非是计算机的算力,以及程序员编写业务逻辑的时间。
行业上其实已经存在一些工业仿真软件。但这类仿真软件往往针对某些特定场景高度定制化,数据埋点往往不全,缺乏通用的数据库接口,难以结合真实业务产生的数据进行仿真,这样就失去与真实业务进行比较的可能。
利用 SimPy 我们可以构建一套完全开源的仿真方案,可以完全私有定制业务场景。利用 Python 强大的生态,仿真数据从来源到输出分析,可以衔接所有开源流行的数据分析框架。
目前,我们已经利用 SimPy 仿真模拟物流核心分拣业务,结合 MySQL,Tableau,Pandas,Spark 构建一整套完整的报表可视化分析体系,已经能够成功应用于现代物流中,为分拣业务提供持续优化改良方案。
我们创造性地解决了一些原有软件仿真中欠缺的环节,这些内容将会在接下来的文章中分享。
作为本系列文章的开篇,我们将简要地介绍 SimPy 框架的基本理念。
官方资料
SimPy 是一个基于标准 Python 以进程为基础的离散事件仿真框架。
SimPy 中的进程是由 Python 生成器构成,生成器的特性可以模拟具有主动性的物件,比如客户、汽车、或者中介等等。SimPy也提供多种类的共享资源(shared resource)来描述拥挤点(比如服务器、收银台和隧道)。
仿真运行速度非常快,仿真中的模拟时间长短不影响仿真运行效率,仿真中的模拟时间单位可以任意指定,一秒、一年、一小时都是允许的。
SimPy 安装
SimPy 可以同时在 Python 2 (>=2.7)以及 Python 3(>=3.2)上运行。只要有pip,轻松安装。“$ pip install simpy”
手动安装 SimPy 也非常方便。提取存档,打开存放 SimPy 的 terminal 窗口,然后输入:“$ python setup.py install”
你可以选择性地运行 SimPy 测试文件以了解软件是否可行。前提是要安装 pytest 包。并在 SimPy 的安装路径下运行下列命令行:“$ py.test --pyargs simpy”
SimPy 核心概念
SimPy 是离散事件驱动的仿真库。所有活动部件,例如车辆、顾客,、即便是信息,都可以用 process (进程) 来模拟。这些 process 存放在 environment (环境) 。所有 process 之间,以及与environment 之间的互动,通过 event (事件) 来进行.
process 表达为 generators (生成器), 构建event(事件)并通过 yield 语句抛出事件。
当一个进程抛出事件,进程会被暂停,直到事件被激活(triggered)。多个进程可以等待同一个事件。 SimPy 会按照这些进程抛出的事件激活的先后, 来恢复进程。
其实中最重要的