21、线性预期在多场景中的应用与挑战

浮生若梦622

于 2025-10-02 16:36:48 发布

阅读量21

点赞数

CC 4.0 BY-SA版权

分类专栏：预期行为：智能的未来文章标签：线性预期合作代理路径查找

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/opencv7vision/article/details/153465594

预期行为：智能的未来专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

线性预期在多场景中的应用与挑战

合作代理实验

为了验证线性预期在合作场景中的应用，进行了相关实验。实验中两个代理的任务是在最短时间内拾取所有目标，具体由哪个代理拾取某个目标并不重要。

实验共进行了三次。第一和第二次使用了之前实验中的同一对代理，第三次则使用了一个合作预期代理和一个合作反应代理。预期代理一旦意识到自己会比反应代理先到达某个目标，就会告知反应代理，反应代理随后会忽略该目标。为此，将“其他代理正在追逐我预计会拾取的目标”添加到U集合，将“向其他代理发送应避开该目标的消息”添加到X集合。

实验结果如下表所示：
| 代理类型 | 完成任务平均用时（时间单位） |
| — | — |
| 两个反应代理 | 18.5 |
| 竞争的预期和反应代理 | 17 |
| 合作代理 | 15 |

从结果可以看出，合作代理表现最佳，用时接近估计的最优时间14个时间单位。

在这个场景中，只有一个代理是预期代理，另一个是普通反应代理。即使让另一个代理也成为具有相同世界模型的预期代理，性能也不会提升。因为两个代理会做出相同的预测，从而相互发送双方都已得出的结论信息。但在更现实的场景中，当代理对世界的信息不完全相同时，这种方法可能会有成效。当一个预期代理模拟另一个预期代理的预期行为，而后者又模拟前者的预期行为时，情况会变得复杂。解决这个问题的一种方法是只模拟其他代理的反应组件，当一个代理修改其反应组件时，应向其他代理广播此修改信息，这样仍能进行线性预期。这与递归建模方法不同，递归建模方法中一个代理对另一个代理的建模会包含该代理对其他代理的模型，导致模型的递归嵌套。

复杂世界中的路径查找

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。