自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 强化学习落地思考

从实用主义的角度看,模型对于强化学习是必不可少的,因为只有仿真模型才能赋予强化学习无限探索的能力,而不会对真实世界造成损害。因此应该尽量找到现成可用的仿真模型,但是,模型的误差会对强化学习的训练造成影响,所以需要通过专家知识和真实数据对模型进行调整和优化,以提升仿真的精确度。同时在训练的过程中使用域随机化的方法,以提升模型的泛化能力。如果实在没有现成可用的模型,或模型获取成本过高。也要尽量获取真实数据,通过真实数据来训练模型,这种时候就需要额外考虑模型的可解释性问题,以保证模型的有效性。

2023-12-06 11:32:39 977

原创 用python写leetcode的脑筋急转弯题目

如有问题或建议请发邮箱457169663@qq.com三个脑筋急转弯 更文时间:2018/11/04用python刷leecode的题目NIM游戏 桌子上有一堆石头,每次你们轮流拿掉 1 - 3 块石头。 拿掉最后一块石头的人就是获胜者。你作为先手。编写一个函数,来判断你是否可以在给定石头数量的情况下赢得游戏。我们可以假设一下,如果桌子上只有1-3块石头,你第一次就可以全收...

2018-11-04 21:50:52 572

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除