生物生产与污水处理中的机器学习应用
在生物技术和环境工程领域,机器学习正发挥着越来越重要的作用。本文将介绍两个不同领域的应用案例,一是利用支持向量机(SVM)预测苏云金芽孢杆菌(B. thuringiensis)的蛋白质生产,二是使用基于树的机器学习模型预测污水处理厂(WWTPs)中的总氮含量。
苏云金芽孢杆菌蛋白质生产预测
- 数据与变量 :研究使用了三个不同菌株的十批实验数据。在线测量变量包括部分氧气压力(pO2)、pH、搅拌(Agit)和曝气(Aer);离线测量变量有光密度(OD)、生物量(Bio)、葡萄糖(Glc)、菌群(Fl)和孢子(Sp)。此外,还将菌群和孢子的对数以及菌株数量作为输入。在进行SVM之前,根据邻域成分分析对输入进行排序以指导特征选择。结果表明,pO2、菌株数量、生物量和孢子是最重要的变量,而菌群及其对数对蛋白质生产的相关性最低。
- 内核探索与模型评估 :探索了线性、二次和高斯三种内核,并对八种输入变量组合进行了评估,通过均方根误差(RMSE)来衡量模型性能。结果显示,二次内核的模型5在训练数据上的预测效果最佳,且在训练集和验证集之间表现良好,但需要10个预测变量。高斯内核的模型8在训练集和验证集之间也取得了较好的平衡,且RMSE值与模型5相似。由于模型8具有更高的在线适用性,因此被选为最佳模型。
| 模型 | 高斯内核RMSEt | 高斯内核RMSEv | 二次内核RMSEt | 二次内 |
|---|
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



