我将带头强化学习!

卷友们好,我是rumor。

我一直是一个文字型学习者,具体什么意思呢,就是我在听任何课时,注意力都集中不到半小时

大学的时候我们老师很爱写板书,还很爱考课上的习题,但无论我怎么努力,都会有那么一刻灵魂出窍,然后就再也跟不上了。于是我干脆弃疗,良心不安的时候老师在上面讲我在底下自学,没有良心的时候就白天上课刷手机,晚上再自习补课。

于是长期下来我养成了快速自学的能力,看书看论文都比较快,还爱整理成笔记。

但我依旧有很多想学的东西没有学,比如多模态,比如强化学习。最近看到的谷歌和OpenAI的一些前沿的研究,都在用强化学习去训练大模型了,这是我认为走向通用人工智能的必备技术之一

我有好几次想开始强化学习,甚至已经在B站收藏了李宏毅老师的公开课,甚至在下班回家的出租车上点了播放,然而我还是没有撑过policy gradient就神游太虚了。

直到Datawhale给我发来这个:

2eace8df59470dd4b67fbf658d108d5a.png

我感觉我的强化学习之路终于要开始了!

目前已经开始看了,等学完之后准备写个长文,先分享几个我觉得很赞的点吧:

  1. 这本书是来自中科院、北大、清华的硕士大佬同学出品的,从他们的角度去写,更能懂现在初学者困惑的一些点

  2. 这本书综合了李宏毅、周博磊、李科浇三个老师热门网课的内容,非常全面

  3. 这本书,它不是很厚!!! 这一点对初学者真的太重要了,要知道我这么多年从来没把花书啃完过

那先写到这里了,不能耽误自己学习。

5458aea05fbc876e0e68f40b78560192.png

66dba956d7286e0074e5ee87f5b716ad.png


大家好我是rumor

一个热爱技术,有一点点幽默的妹子

欢迎关注我

带你学习带你肝

一起在人工智能时代旋转跳跃眨巴眼

后台回复 强化学习,加入一起学习

「我要两周啃完这本书!」7338d217a6cf1da7f33c2692466902ea.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值