- 博客(2)
- 收藏
- 关注
原创 强化学习落地思考
从实用主义的角度看,模型对于强化学习是必不可少的,因为只有仿真模型才能赋予强化学习无限探索的能力,而不会对真实世界造成损害。因此应该尽量找到现成可用的仿真模型,但是,模型的误差会对强化学习的训练造成影响,所以需要通过专家知识和真实数据对模型进行调整和优化,以提升仿真的精确度。同时在训练的过程中使用域随机化的方法,以提升模型的泛化能力。如果实在没有现成可用的模型,或模型获取成本过高。也要尽量获取真实数据,通过真实数据来训练模型,这种时候就需要额外考虑模型的可解释性问题,以保证模型的有效性。
2023-12-06 11:32:39
977
原创 用python写leetcode的脑筋急转弯题目
如有问题或建议请发邮箱457169663@qq.com三个脑筋急转弯 更文时间:2018/11/04用python刷leecode的题目NIM游戏 桌子上有一堆石头,每次你们轮流拿掉 1 - 3 块石头。 拿掉最后一块石头的人就是获胜者。你作为先手。编写一个函数,来判断你是否可以在给定石头数量的情况下赢得游戏。我们可以假设一下,如果桌子上只有1-3块石头,你第一次就可以全收...
2018-11-04 21:50:52
572
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人