自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

ACM_hades的博客

菜小白—NLP

博客等级

码龄8年

135
原创

265
点赞

833
收藏

79
粉丝

关注

私信

热门文章

分类专栏

RL
NLP 40篇
ACM 22篇
Python 17篇
Tensorflow 18篇
ML 17篇
Pytorch 2篇

最新评论

【机器学习】密度聚类算法之HDBSCAN
小吕布鑫爱貂蝉: 和官方网站的不太一样，聚类簇那儿是减lamba(birth)而不是lamba(death)，不然最后的簇无法计算稳定性
【机器学习】密度聚类算法之HDBSCAN
小吕布鑫爱貂蝉: 同样的，卡在这一步上了
优先队列
Linzy️: data[]似乎也可以不用，用cin>>Heap[i]存入就行，降低空间复杂度
优先队列
Wind_Qiu: pop函数有两个地方有错，第30行，int result = Heap[1];你的堆是从下标1开始的，不是从下标0开始的。第31行，int x = Heap[Heap_size--]; 先是记录最后一个元素，size再减减，先减减的话记录的是倒数第二个元素，这样会造成倒数第一个元素丢失的。
支持向量机(SVM)——python代码实现
qq_63937295: 你好，你解决这个问题了吗，我也想知道怎么改

RL

关注

强化学习

关注数：文章数：1 文章阅读量：2156 文章收藏量：4

作者: 菜小白—NLP

这个作者很懒，什么都没留下…

展开

专栏收录文章

马尔可夫决策过程(MDP)

一、强化学习引入强化学习的一个经典简化图：在上图中Agent首先观察获取当前环境的状态StS_tSt,然后根据StS_tSt采取一个行动AtA_tAt与环境进行交互，在动作AtA_tAt作用下环境的状态由StS_tSt转变为St+1S_{t+1}St+1,同时环境会给出立即给Agent一个回报RtR_tRt。如此循环下去，Agent与环境进行不断地交互从而产生很多数据。强化学习...

原创 2020-04-18 22:32:01 · 2158 阅读 · 0 评论