4、机器学习入门:从交叉熵方法到神经网络应用

从交叉熵到神经网络应用

机器学习入门:从交叉熵方法到神经网络应用

1. 交叉熵方法

在机器学习领域,我们已经了解了监督学习和无监督学习算法。而交叉熵方法则属于强化学习算法类别。它是一种解决优化问题的技术,旨在找到使特定函数最小化或最大化的最佳参数。

交叉熵方法通常包含以下几个阶段:
1. 生成随机样本 :生成我们试图优化的变量的随机样本。在深度学习中,这些变量可能是神经网络的权重。
2. 执行任务并记录性能 :运行任务并存储其性能数据。
3. 识别最佳运行并选择变量 :找出表现最佳的运行,并选择表现最优的变量。
4. 计算新的均值和方差 :基于最佳运行结果,为每个变量计算新的均值和方差,并生成新的变量样本。
5. 重复步骤直至停止 :重复上述步骤,直到达到停止条件或系统不再改进。

举个例子,假设我们要构建一个从特定高度发射后能飞行最长距离的模型飞机。飞机飞行的距离是其机翼大小、角度、重量等变量的函数。我们每次记录这些变量,发射飞机并测量飞行距离。通过创建统计数据,选择最佳和最差的运行情况,我们可以确定哪些变量值可能是最优的。例如,如果在最佳运行中飞机的机翼都具有特定尺寸,我们可以认为这个尺寸可能是飞机长距离飞行的最优选择。反之,如果在最差运行中机翼处于某个特定角度,我们就知道这个角度不适合飞机机翼。通过这种方式,我们可以为每个变量生成概率分布,这些概率不再是随机的,而是基于我们所获得的反馈。

这个方法通过运行反馈(飞机飞行的距离)来确定问题的最佳解

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值