机器学习入门:从交叉熵方法到神经网络应用
1. 交叉熵方法
在机器学习领域,我们已经了解了监督学习和无监督学习算法。而交叉熵方法则属于强化学习算法类别。它是一种解决优化问题的技术,旨在找到使特定函数最小化或最大化的最佳参数。
交叉熵方法通常包含以下几个阶段:
1. 生成随机样本 :生成我们试图优化的变量的随机样本。在深度学习中,这些变量可能是神经网络的权重。
2. 执行任务并记录性能 :运行任务并存储其性能数据。
3. 识别最佳运行并选择变量 :找出表现最佳的运行,并选择表现最优的变量。
4. 计算新的均值和方差 :基于最佳运行结果,为每个变量计算新的均值和方差,并生成新的变量样本。
5. 重复步骤直至停止 :重复上述步骤,直到达到停止条件或系统不再改进。
举个例子,假设我们要构建一个从特定高度发射后能飞行最长距离的模型飞机。飞机飞行的距离是其机翼大小、角度、重量等变量的函数。我们每次记录这些变量,发射飞机并测量飞行距离。通过创建统计数据,选择最佳和最差的运行情况,我们可以确定哪些变量值可能是最优的。例如,如果在最佳运行中飞机的机翼都具有特定尺寸,我们可以认为这个尺寸可能是飞机长距离飞行的最优选择。反之,如果在最差运行中机翼处于某个特定角度,我们就知道这个角度不适合飞机机翼。通过这种方式,我们可以为每个变量生成概率分布,这些概率不再是随机的,而是基于我们所获得的反馈。
这个方法通过运行反馈(飞机飞行的距离)来确定问题的最佳解
从交叉熵到神经网络应用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



