
强化学习
文章平均质量分 95
无水先生
擅长数学,能熟练应用泛函分析、统计学、随机过程、逼近论、微分几何、非欧几何(双曲、共形)等数学理论,有数学建模能力。从事图像处理二十年以上,从事人工智能行业10年以上;在船舶、通信、铁路、教育等行业开发软件产品。
展开
-
使用强化学习训练神经网络玩俄罗斯方块
在 2024 年暑假假期期间,Tim学习并应用了Q-Learning (一种强化学习形式)来训练神经网络玩简化版的俄罗斯方块游戏。在本文中,我将详细介绍我是如何做到这一点的。我希望这对任何有兴趣将强化学习应用于新领域的人有所帮助!原创 2025-01-05 12:17:13 · 1362 阅读 · 0 评论 -
强化学习,第 5 部分:时间差异学习
R强化学习是机器学习中的一个领域,它引入了智能体在复杂环境中学习最佳策略的概念。代理从其操作中学习,从而根据环境的状态获得奖励。强化学习是一个具有挑战性的话题,与机器学习的其他领域有很大不同。原创 2024-08-29 10:13:25 · 1988 阅读 · 0 评论 -
强化学习和Q-Learning的综合研究
在我今天的中等帖子中,我将教您如何实现 Q-Learning 算法。但在此之前,我将首先解释 Q-Learning 背后的想法及其局限性。请务必具备一些强化学习 (RL) 基础知识。否则,请查看我之前关于 RL 背后的直觉和关键数学的文章。原创 2024-06-20 19:46:10 · 2809 阅读 · 0 评论 -
通过强化学习彻底改变大型数据集特征选择
了解强化学习如何改变机器学习模型的特征选择。通过实际示例和专用的 Python 库了解这种创新方法的过程、实现和好处。原创 2024-05-31 14:00:40 · 3647 阅读 · 2 评论 -
Q-Learning 简介:初学者教程(1)
强化学习强调无模型学习算法,因此出现Q-Learning,Q-Learning算法酷似“有限状态自动机”模型,只是增加了奖励机制和Agent机制,而Agent与粒子群算法、蒙特卡洛算法是有关的。本文介绍这个算法框架。原创 2024-05-30 09:00:17 · 3883 阅读 · 0 评论 -
强化学习,第 2 部分:政策评估和改进
R强化学习是机器学习中的一个领域,它引入了必须在复杂环境中学习最优策略的智能体的概念。智能体从其行为中学习,这些行为在给定环境状态的情况下产生奖励。强化学习是一个困难的话题,与机器学习的其他领域有很大不同。这就是为什么只有当给定的问题无法解决时才应该使用它。原创 2024-05-27 12:30:57 · 2646 阅读 · 0 评论 -
强化学习,第 3 部分:蒙特卡罗方法
强化学习是机器学习中的一个领域,它引入了必须在复杂环境中学习最优策略的智能体的概念。智能体从其行为中学习,这些行为在给定环境状态的情况下产生奖励。强化学习是一个困难的话题,与机器学习的其他领域有很大不同。这就是为什么只有当给定的问题无法解决时才应该使用它。原创 2024-05-27 10:08:15 · 2690 阅读 · 0 评论 -
【机器学习高级】强化学习综述
强化学习是一种强大的方法,可以帮助人工智能 (AI) 系统在看不见的环境中实现最佳结果。他们从每个行动的反馈中学习,并自我发现实现最终结果的最佳处理路径。该算法还能够延迟满足。最好的整体策略可能需要短期的牺牲,因此他们发现的最佳方法可能包括一些惩罚或一路回溯。原创 2024-05-23 00:47:41 · 3604 阅读 · 0 评论 -
强化学习的 9 个令人惊畏的实际应用
强化学习是顺序决策的框架。它与通常的监督设置不同,因为不存在标签。在这个框架中,“智能体”与“环境”交互以获得经验,智能体从中学习执行最优化的行动,从而最大化其回报。原创 2024-04-01 11:52:43 · 3012 阅读 · 0 评论