Python 高光谱分析工具(PyHAT)简介
1. 混合模型与回归结果可视化
在光谱分析中,预测测试集的成分含量准确性至关重要。以预测 SiO₂ 重量百分比为例,混合偏最小二乘(PLS)模型在整体上比单独的 PLS 或最小绝对收缩和选择算子(LASSO)模型更准确,表现为均方根误差(RMSE)更低。
为了构建混合子模型,需要重复交叉验证过程,找到每个子模型的最佳设置。首先使用一个涵盖全值范围的初始模型作为初步猜测,以此确定用于最终预测的子模型。这种混合子模型方法与集成方法有相似的优点。
PyHAT 的原位图形用户界面(GUI)具备绘制回归结果的能力,还能自动计算 RMSE,这是衡量回归模型准确性的标准指标。通过比较优化的 PLS 和 LASSO 模型结果与多个 PLS 子模型混合的结果,可以明显看出混合子模型的 RMSE 更低,准确性更高。
2. 数据探索示例
2.1 数据预处理
在 Jupyter Notebook 中使用 PyHAT 进行数据探索时,首先要对数据进行加载、掩膜和归一化处理。以下是数据预处理的流程:
1. 加载数据。
2. 对数据进行掩膜操作。
3. 对掩膜后的数据进行归一化处理。
2.2 降维方法选择
GUI 为用户提供了多种降维算法供选择,包括主成分分析(PCA)、局部线性嵌入(LLE)、t - 分布随机邻域嵌入(t - SNE)以及两种独立成分分析(ICA)方法:“快速 ICA”和“特征矩阵联合近似对角化(JADE)ICA”。在本示例中,我们选择使用 PCA 和 t - SNE。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



