基于深度学习的作物产量预测与云生命科学制造系统新架构
1. 作物产量预测的深度学习应用
随着全球人口的不断增长,为满足未来的粮食需求,提高粮食产量变得至关重要。利用基因型和环境信息来预测作物或动物物种的表型,是增加粮食产量的有效途径之一。而深度学习中的深度神经网络,因其在处理复杂非线性数据方面的强大能力,成为了构建预测模型的理想选择。
1.1 数据预处理
在进行作物产量预测之前,数据预处理是关键步骤。以Syngenta数据集为例,其中包含近19,500个独特的遗传标记,但存在大量缺失值。具体操作步骤如下:
- 设定阈值筛选 :为每个遗传标记设定允许的最大缺失值阈值,这里采用23%的阈值,将缺失值超过该阈值的遗传标记剔除。
- 次要等位基因频率筛选 :使用0.01的次要等位基因频率(MAF)对所有遗传标记进行进一步筛选。
- 缺失值插补 :由于遗传数据集为仅含 -1、0、1 三个值的分类数据,尝试了中位数和最频繁值两种插补方法,经验证中位数方法在验证集上效果更好,因此采用中位数方法进行插补。经过上述预处理,剩余4005个遗传标记。对于环境数据集,仅进行了归一化处理。
1.2 神经网络架构与训练
为了进行产量和对照产量的预测,分别训练了两个深度神经网络,同时还训练了一个用于2017年天气预测的神经网络。以下是产量预测神经网络的详细信息:
- 网络结构 :采用21层的深度神经网络,每层有40个神经元。
- 训练步骤
超级会员免费看
订阅专栏 解锁全文
1384

被折叠的 条评论
为什么被折叠?



