数学模型:从模拟到实战的探索
1. 模式识别与模拟模型概述
在模式识别领域,我们面临着诸多挑战。以光学字符识别(OCR)系统为例,数字电视信号不存在成像误差、打印机油墨斑点、暗点或纸张褶皱等问题,因此测试完美比特模式(图像)与设备字体中的字符是否完全匹配相对简单。然而,现实中的OCR系统远没有这么理想,即使是合理的OCR系统,在处理商业文档时也难以达到100%的准确率。最终,华尔街的客户将业务带回了菲律宾,采用三人录入文档并在有分歧时进行三选二投票的方式。之后,我们转向处理消费者提交的手写调查问卷,虽然这个问题更具挑战性,但报酬较低,且客户对准确率的要求也不高。不过,由于成本问题,这份合同最终还是回到了使用监狱劳动力录入数据的一方。
这一经历让我们明白,任何合理的模式识别系统都无法始终保持100%的准确率。要提高系统性能,就需要仔细评估系统的工作情况,找出错误所在。
模拟模型是一类重要的第一性原理模型,它们并非主要由数据驱动,但对于理解各种不同的现象非常有价值。模拟模型试图复制现实世界的系统和过程,使我们能够观察和分析它们的行为。通过简单的模拟来捕捉系统的行为复杂性,根据奥卡姆剃刀原理,这样的模拟必须能够解释系统的工作原理。正如著名物理学家理查德·费曼所说:“我无法创造的,我就无法理解。”如果无法对某个系统进行模拟并在观察结果中获得一定的准确性,那么就不能说真正理解了这个系统。
1.1 蒙特卡罗模拟
蒙特卡罗模拟使用随机数来合成替代现实。通过在略微扰动的条件下多次复制一个事件,我们可以生成结果集的概率分布。这也是统计显著性排列检验的基本思想。例如,在棒球比赛中,我们可以用随机抛硬币来模拟击球手的击球或出局情况,从而模拟任意数量的职业生涯
超级会员免费看
订阅专栏 解锁全文
2883

被折叠的 条评论
为什么被折叠?



