机器学习的多种学习方法与项目实践
1. 隐藏马尔可夫模型与无监督学习的应用
1.1 隐藏马尔可夫模型
隐藏马尔可夫模型中,状态仅部分可观测,但其输出是完全可观测的。由于观测数据不足以完全确定状态,因此需要无监督学习来更全面地发现这些隐藏状态。该模型算法会根据已知的部分可观测状态序列和完全可观测输出,学习可能的下一状态。它在语音、文本和时间序列等顺序数据问题上有重要商业应用。
1.2 强化学习
强化学习是机器学习的第三大分支,智能体基于接收到的反馈(奖励)在环境中确定最优行为。其目标是随时间最大化累积奖励。近年来,强化学习取得了显著成果,如DeepMind在2013年用其在Atari游戏中达到超人水平,2016年AlphaGo击败世界顶级围棋选手李世石。目前,强化学习被用于解决多种问题:
- 股票市场交易:智能体买卖股票并获得利润或损失作为奖励。
- 视频和棋盘游戏:智能体做出游戏决策并赢得或输掉比赛。
- 自动驾驶汽车:智能体控制车辆,根据是否保持路线或发生碰撞获得奖励。
- 机器控制:智能体在环境中移动,根据是否完成任务获得奖励。
在简单的强化学习问题中,存在有限马尔可夫决策过程,但现实中奖励是未知且动态的,可应用无监督学习来发现未知奖励函数并进行近似,进而应用强化学习解决方案增加累积奖励。
1.3 半监督学习
监督学习和无监督学习虽为机器学习的两大不同分支,但它们的算法可在机器学习管道中混合使用。当想充分利用少量标签,或从无标签数据中发现新的未知模式时,可使用半监督学习,即监督和无监督学习的混合方法。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



