
python
文章平均质量分 74
waterHBO
分享有趣的内容,记录一些探索过程。 平时做做兼职,有事请私聊。
展开
-
强化学习: 继续看 Q-Learning + FrozenLake, 解决更大的地图 8x8, 10x10
因为,我之前在什么地方看过类似的思路。可能是算法题里面见过的。:比完全随机奖励的 Q-learning 更快收敛。8x8的地图很容易失败, 这个问题,我之前讲过。就是说,鼓励探索,探索的过程,也是有奖励的。如何解决, 一句话,根据距离来修改奖励.然后让 GPT 根据这个思路来写代码。:机器人不会盲目探索,而是朝目标前进。:鼓励它更早学习正确路径。原创 2025-03-09 11:48:08 · 373 阅读 · 0 评论 -
强化学习: 从头开始看 Q-Learning + FrozenLake-v1
说白了,q-table 记录的就是: 👉「在第 X 个格子,往 Y 方向走,能有多大收益。理解: 一个随机数,被 epsilon 分割为左右2个区域, 分别对应不同的选择。自己写的时候,我发现,其实可以简写为: Q = Q + new_stuff。也可以理解为:新 Q 值 = 老 Q 值的 (1 - α) + 新经验的 α。值:代表这个状态下执行这个动作,预计可以得到的“总回报”(长期奖励)。“用表格(q-table)记住在每个状态下做每个动作的价值,然后根据这个表格不断优化,找到最好的行为方式。原创 2025-03-07 15:02:11 · 556 阅读 · 0 评论 -
强化学习 FrozenLake 简单探索 2个例子。
对于 4x4 的地图,很容易得到结果,但是如果换成 8x8 的地图,很容易失败!就是因为地图太大,所以失败率太高,永远无法到达目标!第3种方法, sarsa , 后面再继续写。搜索范围越大,越容易失败。原创 2025-03-04 09:12:34 · 361 阅读 · 0 评论 -
2/10 python 深度学习 项目调试 图像分割 detectron2
项目来源: https://github.com/facebookresearch/detectron2项目目的: 图像处理,目标检测牛逼的地方: facebook 出品 + 30.3k star.项目调试, 这是第二篇。每个项目做到什么程度。花多少时间。几个小时。最终要达到什么成就。写一篇博客就行了?这10个项目,顺序如何。从简单的开始,还是只按照自己的兴趣来。爬虫。js。web。都需要回答这几个问题。原创 2024-10-22 15:53:56 · 520 阅读 · 0 评论 -
python 制作 发货单 (生成 html, pdf)
其实也可以加一个 logo, 加个图片,更好看一些。整体比较简单,但是对有些人或许很有用。某个小店,想做个发货单。原创 2024-10-27 18:35:16 · 1173 阅读 · 0 评论 -
3/10 python 深度学习 项目调试 识别数学公式 LaTeX-OCR
项目来源: https://github.com/lukas-blecher/LaTeX-OCR项目目的: 把带有数学公式的图片转为 LaTex 数学公式。原创 2024-10-23 15:16:23 · 647 阅读 · 0 评论 -
1/10 python 深度学习+项目调试 图像分割 segment-anything
masks = mask_generator.generate(image) # 运行这一步, gpu 用了 5.6G / 8.7G。这里, take = 10 , 只选取10个即可。其实,简单的图片, 3个 masks 就够了。图像相关的项目,需要显存。原创 2024-10-21 16:01:48 · 878 阅读 · 0 评论 -
python 基础笔记(其实有点内容的)
print(math.gamma(n)) # 求 (n-1) 的阶乘。原创 2024-10-16 21:53:52 · 1011 阅读 · 0 评论 -
python 基础笔记 2(函数, 类)
函数是为了调用__init__中的变量,在输出的时候,能以可读的方式展。()函数是给开发者看的,是一个地址,代码部分和__str__()是一样的,如果想直接使用 self 作为一个可迭代对象的话,需要自己来实现一个。为什么这些序号不连贯,因为有些很熟悉的东西,我都删了。把很久以前,自己写的笔记发布出来。现在粉丝多了,也不觉得丢人了。原创 2024-10-20 12:14:05 · 362 阅读 · 0 评论