3、机器学习基础方法解析

机器学习基础方法解析

1. 强化学习

强化学习主要适用于处理包含长期与短期奖励权衡的问题。它在许多领域都被证明是有效的,如机器人控制、电梯调度、电信、西洋双陆棋和跳棋等。强化学习具有影响力的两个因素是:使用样本提高性能,以及使用函数逼近处理大规模场景。

一个简单的强化学习模型包含以下部分:
1. 一组环境状态;
2. 一组动作;
3. 状态间转移的规则;
4. 定义动作即时标量回报的规则;
5. 指定智能体观测的规则。

2. 决策树

决策树是一种辅助决策的技术,它使用树状结构的选择模型及其可能的意义,包括偶然事件结果、资源成本和服务等。它是一种有监督的机器学习算法,陈述有限。决策树常用于运筹学,特别是决策分析,以帮助找到最有可能实现目标的方法,同时也是机器学习和数据挖掘中广泛使用的工具。其目标是根据各种输入参数建立一个预测目标变量/输出值的模型。

决策树的相关概念如下:
- 根节点 :将数据划分为两个或更多子集,其关键属性通过属性选择度量(ASM)技术选择。
- 分支 :完整决策树的一部分,也称为子树。
- 分裂 :使用箭头根据 if - else 条件将一个节点划分为两个或更多子节点的过程。
- 决策节点 :将子节点进一步划分为后续子节点的节点。
- 叶节点或终端节点 :决策树的终点,子节点不能再进一步分裂。
- 剪枝 <

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值