多问题双边重复谈判与人机协作模式识别的研究
多问题双边重复谈判中的智能体设计
在多问题双边重复谈判场景中,设计一个能与人类玩家达成协议的智能体至关重要。智能体需要实时关注人类玩家在谈判中的行为,包括是否威胁智能体、是否接受之前的提议以及是否透露偏好等,以此做出合理决策。
实验设置
- 谈判框架 :智能体基于交互式仲裁指南在线(IAGO)谈判框架构建,该框架可用于设计能与人类进行谈判的自动化智能体。
- 谈判内容 :人类和智能体需就4种物品进行谈判,每种物品有5个。双方对这4种物品被赋予预先定义但不一定相同的价值,参与者最高可得50分。
- 谈判规则 :每场游戏有3轮谈判,每轮限时3分钟。只有当所有物品都分配给智能体或人类参与者,或者谈判时间达到3分钟时,谈判才会结束。若时间到但未达成完整提议,即部分物品仍未决定归属,每个玩家将获得相当于其最佳替代协议(BATNA)的分数,BATNA是谈判失败且无法达成协议时参与者可采取的最有利替代方案。
- 面临挑战 :
- 游戏最多有3轮谈判,人类玩家可能选择不参与第三轮谈判,因此智能体需说服人类继续谈判,否则整体得分会减少。
- 谈判开始时,双方的偏好信息是不完整的。
- 人类的得分值和BATNA不会被透露。
智能体设计
智能体的主要目标是在3轮谈判后最大化总得