- 博客(33)
- 收藏
- 关注
原创 【Chen2022】 Rethinking Data Augmentation for Robust Visual Question Answering
1)放宽图像文本配对要求,问题中object在图像存在即可,获得合理的pairs;2)设计一个基于knowledge distillation的答案分配,为pairs生成伪答案。
2022-11-25 15:22:39
417
原创 强化学习RL——有限马尔可夫决策
在前一章老虎机的问题中,action对此后任一时刻的奖励影响并没有被考虑到。这里,将引入概率论中的条件概率来描述前一action对后一action的影响,从而考虑到后续情况和贯穿未来的奖励。
2022-08-02 15:29:16
513
原创 强化学习RL——多臂老虎机问题
从强化学习的本质出发,以最简单的多臂老虎机问题为例引入greedy等相关办法的说明,并对其基本影响因素进行了讨论。
2022-07-21 10:54:14
842
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人