机器学习在地下特征表征中的应用:回归与聚类分析
1. 神经网络基础
在机器学习领域,神经网络是一种强大的工具,尤其在处理复杂的非线性关系时表现出色。在本次研究中,神经网络用于处理分类和回归任务。对于分类任务,通常会使用特定的激活函数;而对于回归任务,则使用 1:1 线性函数作为激活函数。激活函数的主要作用是为计算引入非线性特性,这对于神经网络学习复杂的模式至关重要。
输入层的神经元没有激活函数,样本的每个特征值会被输入到输入层对应的神经元中。输入层的每个神经元与后续隐藏层的每个神经元相连,这些连接的权重是神经网络训练过程中需要计算的重要参数,它们对于特征和目标之间的非线性复杂功能映射起着关键作用。如果神经网络没有激活函数,它将退化为高阶线性回归模型。
激活函数的一个重要特性是可微性,这使得在网络中反向传播误差以更新连接的权重和参数时,能够执行反向传播优化策略。
本次研究中,有 13 个特征和 2 个目标需要合成。神经网络的输入层和输出层分别有 13 个和 2 个神经元。采用了两个全连接的隐藏层,第一层有 9 个神经元,第二层有 5 个神经元。这种连接方式总共产生了 188 个需要计算的参数/权重,其中 126 个参数定义了输入层和第一个隐藏层之间的连接,50 个参数定义了第一个和第二个隐藏层之间的连接,12 个参数定义了第二个隐藏层和输出层之间的连接。研究中使用共轭梯度反向传播来更新神经元的参数。而每层的神经元数量、隐藏层的数量以及激活函数则作为人工神经网络(ANN)模型的超参数。
2. 聚类技术
聚类的目标是将数据分组到一定数量的簇中,使得属于同一簇的样本具有最大的统计相似性,并且与其他簇中的样本不同。在本研究中,
超级会员免费看
订阅专栏 解锁全文
507

被折叠的 条评论
为什么被折叠?



