10、人群模拟器中基于逆强化学习的智能体行为模拟

最新推荐文章于 2025-08-23 09:26:43 发布

cherry

最新推荐文章于 2025-08-23 09:26:43 发布

阅读量43

点赞数

CC 4.0 BY-SA版权

分类专栏：大规模多智能体系统：物联网时代的协调与应用文章标签：人群模拟器逆强化学习智能体行为模拟

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/cherry/article/details/149383580

大规模多智能体系统：物联网时代的协调与应用专栏收录该内容

18 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

人群模拟器中基于逆强化学习的智能体行为模拟

一、引言

人群移动一直是一个备受关注的研究领域，在城市规划、灾难预防和商业策略等多个领域有着广泛的应用。然而，使用真实人群进行实验和测试存在诸多实际困难，因此，使用模拟器来复制所需场景成为了一种被广泛接受的解决方案。

智能体模型由于其灵活性和可扩展性，常用于人群模拟。但人类行为难以建模，因为人们的行动往往由目标驱动，而这些目标通常不明确，也不总是遵循最优计划。此外，在大规模人群场景中，对模型的可扩展性和性能要求也很高。

为了解决这些问题，我们提出了一种使用逆强化学习（IRL）的模型。该模型的研究背景是城市行人模拟，旨在提取地图上特定地点周围的行人流动信息，预测哪些地方适合特定业务。我们的目标是部署大量具有不同目标（如购物、工作、娱乐）的智能体，观察环境特征如何影响它们的行为。

我们开发了一个人群模拟器CrowdWalk，最初使用简单的脚本智能体来计算轨迹，后来通过添加一个基于IRL的行为模块进行了扩展。这个模块使智能体能够根据地图上的现有特征做出路径选择，并且即使在不了解场景布局的情况下也能进行导航。

二、相关工作

人群模拟近年来受到越来越多的关注，因为它可以解决社会中的许多重要问题。例如，交通模拟可用于改善交通系统和网络，降低汽车污染；行人模拟可用于设计疏散策略，识别自然灾害或恐怖袭击等具体场景中的潜在问题。

不同的模型被用于实现高效准确的模拟，如元胞自动机模型和社会力模型。但每个模型都有其局限性，如社会力模型在高密度情况下难以准确表示碰撞行为，元胞自动机模型在模拟高速或非均匀速度的智能体时存在问题。为了解决这些问题，研究人员通常会对模型进行扩展，使其

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。