13、人群与人工智能混合系统:CrowdLearn的原理与实践

人群与人工智能混合系统:CrowdLearn的原理与实践

1. CCMB问题与目标函数

在相关应用中,我们用 $C^t$ 表示第 $t$ 个周期产生的所有成本。假设在每个周期开始时,上下文 $X^t$ 是可观测的,但代理采取行动的回报要到周期结束时才会揭晓(即直到人群提交响应,才知道延迟情况)。

CCMB(上下文感知的众包多臂老虎机)的目标是推导出一个最优激励策略,该策略能决定在何种上下文中采取何种行动,以在资源预算范围内最大化回报。CCMB问题是一个决策过程,它将历史观测值 ${X^1, A^1, P^1; X^2, A^2, P^2; \cdots ; X^{t - 1}, A^{t - 1}, P^{t - 1}}$ 和当前上下文 $X^t$ 映射到一个行动 $A^t \in \mathcal{A}$。其目标函数如下:
[
\begin{align }
&\arg\max_{A^t} \sum_{t = 1}^{T} P^t, \quad 1 \leq t \leq T \quad \text{(回报最大化)}\
&\text{s.t.:} \quad \sum_{t = 1}^{T} C^t \leq B, \quad 1 \leq t \leq T \quad \text{(预算约束)}
\end{align
}
]
这个目标函数可以使用自适应线性规划方法来求解。

2. 人群质量控制(CQC)

众包平台面临的一个关键挑战是答案质量参差不齐,一些工作人员可能由于知识有限或主观意见而提供错误答案。现有一些解决方案来解决这个问题:
-

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值