草药物质自动分类与事件地址表示连接性特征提取
1. 草药物质自动分类
在草药物质的分析中,为了实现准确的分类,需要对不同分析技术得到的光谱数据进行一系列处理。
1.1 数据预处理
- 噪声去除 :为避免高频低振幅噪声与物质成分的真实峰混淆,采用样条插值对光谱进行平滑处理。例如,对紫外(UV)光谱进行样条插值平滑,可减少噪声干扰。
- 对齐处理 :色谱方法(薄层色谱TLC和气相色谱GC)会引入实验或仪器误差,如峰位移、峰共洗脱、背景偏移、基线位移和缩放效应等。因此,需要进行对齐处理,即根据保留因子(以时间表示)调整每种物质浓度峰的对应关系。选择与其他模式相关性最佳的模式作为参考光谱,同时考虑物质基本化学成分对应峰的存在。为处理缩放和基线偏移问题,采用乘法散射校正(MSC)。在经典对齐算法中,如相关优化翘曲(COW)和动态时间规整(DTW),COW取得了更好的结果。
1.2 类别发现
由于现有类别的数量未知,采用了具有完全链接准则的层次聚类分析(HCA)这种无监督聚类技术。最终的分区由领域专家通过探索性分析确定,以气相色谱(GC)数据作为探索紫外(UV)和薄层色谱(TLC)数据集的真实参考。选择两种相关距离作为相似度度量,以捕捉物质组成的相关性。聚类结果显示,不同类别的样本在不同分析技术下有一定的一致性,且同一聚类中的光谱形状相似。
1.3 基于熵的模板选择
信息论相关模型在许多领域有应用,基于熵的模板选择策略可用于识别给定集合中最具代表性的模板。对于模板库 $G$,可将其视
超级会员免费看
订阅专栏 解锁全文
9870

被折叠的 条评论
为什么被折叠?



