- 博客(8)
- 收藏
- 关注
原创 强化学习时,某些状态下智能体不能获取全部state
方案1:利用自注意力机制。智能体依旧采集全部的信息,但在自注意力进行softmax前,给不能观测的状态量对应的位置乘上一个-1e-10,这样,几乎不关注≈无法观测,变相实现了对于无法观测信息的处理。方案2:利用LSTM,扩散模型等去预测并补全未知信息。但该方法可能会导致强化学习的回放池等部分一同大改,较为麻烦。在进行强化学习时,智能体有些时候无法探测到某些状态变量。这可能导致一个问题:网络的输入长度不一样。
2023-07-11 18:31:49
258
1
原创 使用Rnn进行中文词性标注时遇到的问题
因此,此时的网络就成了这样:训练一个网络,无论其输入是什么,得出同一个结果。故,对词性进行embedding后不能加入全连接。同时,分类结果以0-52的形式存在并不合理,应当将其映射到(0,1)或者(-1,1)这样的区间。虽然数据集中没有“手机”(毕竟老舍的年代肯定没这个东西),但网络能够结合前文进行推断:结合“一个崭新的”,和“手”能够推断“手机”是名词。我最初的做法是,对汉字和词性转化成0,1,2,3……于是我想到:既然可以对汉字进行embedding,那是否可以对词性也进行embedding呢?
2023-06-03 13:17:41
188
原创 [python]不使用循环,只使用矩阵运算快速计算元胞自动机:以美赛19a为例
python的运行速度较其他语言慢很多,因此在计算元胞自动机的时候会消耗更多时间。因此,试图使用numpy/cupy等的强大矩阵计算能力来进行元胞自动机的计算,从而减少计算耗时。
2023-01-12 13:18:04
603
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人