
强化学习
代码随想随记
211本硕,人工智能方向,前A应用算法专家,发明专利十余项,目前致力于大模型和RAG方向。
懂点工程,会点算法,
如有机器学习/深度学习/大模型/RAG等方向朋友可以一起探讨。
展开
-
Udacity强化学习系列(一)——什么是强化学习,强化学习用来解决什么问题
最近半个月(~10.01)主要初步了解及充电强化学习。强化学习也是机器学习的一个分支,其他两个是我们相对熟悉的监督学习和非监督学习。我们先来看看强化学习主要是什么,可以用来干什么,然后看看与监督学习和非监督学习的区别与联系。学习参考可以看Ref[1],本笔记主要是为了记录在Udacity课程上学习的强化学习内容,以作备忘。分三个部分来说明: 1. 强化学习简介 2. 强化学习与监督学...原创 2018-09-16 15:34:16 · 4892 阅读 · 0 评论 -
Udacity强化学习系列(二)—— 马尔科夫决策过程(Markov Decision Processes)
说到马尔科夫Markov,大家可能都不陌生,陌生的[链接往里走](https://baike.baidu.com/item/%E9%A9%AC%E5%B0%94%E5%8F%AF%E5%A4%AB%E8%BF%87%E7%A8%8B/2952385?fromtitle=%E9%A9%AC%E5%B0%94%E7%A7%91%E5%A4%AB%E8%BF%87%E7%A8%8B&fromid...原创 2018-09-16 15:47:05 · 1039 阅读 · 1 评论 -
David Silver深度强化学习系列更新目录【2019-07-29持续更新】
David Silver深度强化学习系列更新目录第一课原创 2019-07-29 21:40:36 · 831 阅读 · 3 评论