
人工智能
文章平均质量分 95
驼驼学编程
在校大学生,记录一些日常学习内容
展开
-
概率与决策理论
在每一个状态下,采取能够获得最大长期收益的那个动作。换句话说,就是告诉你:在这个状态下做什么,是最聪明的选择?从状态 s 出发,如果之后始终按最优策略 π* 走,最多能拿到多少期望总奖励(也叫回报)?简单来说,它衡量的是:站在当前状态,未来的“潜力价值”有多大。我们不是随便假设π*(S₁)=a₂,而是通过试探性的策略来建立联立方程解 V,然后再回头验证这个策略是否最优。原创 2025-03-28 20:54:30 · 983 阅读 · 0 评论 -
决策树,Laplace 剪枝与感知机
决策树,Laplace 剪枝与感知机原创 2025-03-12 00:17:01 · 937 阅读 · 0 评论 -
游戏树搜索与优化策略:Alpha-Beta剪枝及其实例分析
不盲目计算所有可能,而是边算边排除垃圾选项。原创 2025-03-05 19:58:51 · 1199 阅读 · 0 评论 -
图的路径搜索算法
介绍了几种图的路径搜索算法原创 2025-02-26 19:19:15 · 745 阅读 · 0 评论