4、机器学习入门：从交叉熵方法到神经网络应用

从交叉熵到神经网络应用

青柠汽水308

于 2025-10-07 10:04:57 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习实战指南文章标签：机器学习交叉熵方法神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/solidity8miner/article/details/154374705

深度学习实战指南专栏收录该内容

32 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习入门：从交叉熵方法到神经网络应用

1. 交叉熵方法

在机器学习领域，我们已经了解了监督学习和无监督学习算法。而交叉熵方法则属于强化学习算法类别。它是一种解决优化问题的技术，旨在找到使特定函数最小化或最大化的最佳参数。

交叉熵方法通常包含以下几个阶段：
1. 生成随机样本 ：生成我们试图优化的变量的随机样本。在深度学习中，这些变量可能是神经网络的权重。
2. 执行任务并记录性能 ：运行任务并存储其性能数据。
3. 识别最佳运行并选择变量 ：找出表现最佳的运行，并选择表现最优的变量。
4. 计算新的均值和方差 ：基于最佳运行结果，为每个变量计算新的均值和方差，并生成新的变量样本。
5. 重复步骤直至停止 ：重复上述步骤，直到达到停止条件或系统不再改进。

举个例子，假设我们要构建一个从特定高度发射后能飞行最长距离的模型飞机。飞机飞行的距离是其机翼大小、角度、重量等变量的函数。我们每次记录这些变量，发射飞机并测量飞行距离。通过创建统计数据，选择最佳和最差的运行情况，我们可以确定哪些变量值可能是最优的。例如，如果在最佳运行中飞机的机翼都具有特定尺寸，我们可以认为这个尺寸可能是飞机长距离飞行的最优选择。反之，如果在最差运行中机翼处于某个特定角度，我们就知道这个角度不适合飞机机翼。通过这种方式，我们可以为每个变量生成概率分布，这些概率不再是随机的，而是基于我们所获得的反馈。

这个方法通过运行反馈（飞机飞行的距离）来确定问题的最佳解

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。