53、基于机器学习的奶牛产奶量预测模型研究

基于机器学习的奶牛产奶量预测模型研究

1. 背景与相关工作

在印度,乳制品行业规模庞大且增长迅速,其产值达 3.6 万亿卢比,并且每年以 10%的速度持续增长。然而,奶牛的产奶量受多种因素影响,如牧场季节性、放牧环境、疾病、营养干扰等,存在较大差异。提前预测奶牛产奶量对加工商和农场的组织管理具有重要意义,因为每日产奶量会显著影响能源消耗、工厂利用率和农场收入。

机器学习(ML)方法在医疗领域已显著提升了多种疾病的诊断水平,其模型能够处理实际数据,对缺失值具有较强的鲁棒性,还能评估传统统计模型难以处理的大规模数据集。因此,ML 方法在奶牛养殖决策中具有重要应用价值,有助于农民优化决策系统,提高奶牛的舒适度和生产效率。在奶牛产奶量分组和预测方面,有多种方法可供选择,如数据挖掘程序、遗传算法、判别分析(DA)、决策树、回归方法和人工神经网络(ANN)模型等。

以下是一些相关的研究工作:
- 动态线性模型(DLM) :Jensen 等人建立了 DLM 来预测不同奶牛的产奶量。该模型使用 Wood 函数表示估计的总体日产奶量(DMY),并通过多项式函数表示挤奶间隔时间对预测日产奶量比例的影响,从而持续预测每次挤奶的产奶量。
- 基于神经网络的预测 :Hosseinia 等人利用 ANN 模型,根据奶牛第一胎的产奶数据预测第二胎的产奶量和脂肪百分比,并评估了新神经网络与标准 BLUP 技术的可靠性和有效性。
- ANN 对产奶量的估计 :Grzesiak 等人专注于 ANN 对完整和同质泌乳期产奶量的估计能力。他们使用实际数据和挤奶记录测试日,设计了多个神经网络,并评估了 Wood 模型的参数。
- DA 与 ANN 的比较 :Radwan 等人比较了 DA 和 ANN 的结果,发现 ANN 在数据分类和产奶量预测方面优于 DA,并且首次产犊年龄、每次产犊的配种次数和产犊间隔是评估和预测荷斯坦奶牛产奶量的重要因素。
- AI 在奶牛场的应用 :Fuentes 等人展示了基于机器人奶牛场详细数据的实际 AI 应用,提出了一个 AI 系统模型,用于监测和减轻奶牛热应激,提高奶牛场在全球市场的竞争力。

2. 提出的解决方案
2.1 总体概述

提出了一种基于机器学习(ML)技术的自动化模型来预测奶牛产奶量。考虑的因素包括奶牛的健康状况、食物摄入能力和预期相对产奶量,并基于这些因素和其他变量构建了 ANN 模型。

2.2 奶牛健康状况估计

以往监测奶牛健康状况的工作往往考虑的属性有限,难以准确提前预测疾病。为此,设计了一种基于物联网传感器的创新奶牛监测系统。该系统在奶牛身体上部署健康传感器,测量各种健康因素,测量数据在 MRC 进行检查,并与参考表中的值范围进行比较。

参考表中存储的健康参数平均值及其与汇总值的偏差如下:
|参数|含义|
| ---- | ---- |
|$H_{avg}(t_j)$ 和 $D(H)$|平均心跳及其偏差|
|$T_{avg}(t_j)$ 和 $D(T)$|体温及其偏差|
|$P_{avg}(t_j)$ 和 $D(P)$|脉搏率及其偏差|
|$RU_{avg}(t_j)$ 和 $D(RU)$|反刍值及其偏差|
|$RE_{avg}(t_j)$ 和 $D(RE)$|呼吸值及其偏差|

偏差计算公式如下:
[
\begin{cases}
D(H) = \vert N_H - H_{avg}(t_j) \vert \
D(T) = \vert N_T - T_{avg}(t_j) \vert \
D(P) = \vert N_P - P_{avg}(t_j) \vert \
D(RU) = \vert N_{RU} - RU_{avg}(t_j) \vert \
D(RE) = \vert N_{RE} - RE_{avg}(t_j) \vert
\end{cases}
]
其中,$N_H$、$N_T$、$N_P$、$N_{RU}$ 和 $N_{RE}$ 是对应健康参数的正常范围值。如果偏差超过阈值 $D_{th}$,则奶牛的健康状况(HC)被认为是异常的,否则为正常。

2.3 食物摄入能力(FIC)估计

奶牛的生长与年龄、胎次、泌乳期和妊娠期等因素密切相关,这些因素也会影响其食物摄入能力。FIC 模型基于这些因素推导得出,公式如下:
[
FIC(p, d) = a_0 + (a_1 - a_2 \cdot d) \cdot (1 - e^{-p_a \cdot age})
]
其中,奶牛年龄计算公式为:
[
age = (p - 1) + \frac{d}{365}
]
这里,$FIC(p, d)$ 是基础 FIC,$p$ 是胎次,$d$ 是泌乳天数,$a_0$ 是 FIC 的初始水平,$a_1$ 是 FIC 的最大增加量,$a_2$ 是 $p$ 和 $d$ 之间的交互因子,$p_a$ 是 FIC 的上升速率。

2.4 预期相对产奶量(ERMY)估计

Hogeveen 等人根据奶牛上次挤奶后的时间间隔,估计了观察时间 $t$ 时预期总日产奶量的比例。针对五个农场分别估计了三个参数 $w_0$、$w_1$ 和 $w_2$,公式如下:
[
MY_{relative}(Interval_t) = x_0 + x_1 \cdot Interval_t + x_2 \cdot Interval_t^2
]
这三个参数通过线性回归使用 R 语言的内置函数 lm poly() 进行估计,多项式次数设置为 2。仅使用间隔时间至少为 1 小时且小于 24 小时的观察值,间隔时间超出此范围的观察值被认为不可靠。

2.5 Wood 参数估计

根据学习集,分别为每个农场的初产和经产奶牛估计 Wood 函数的参数。Wood 函数为:
[
y = at^b e^{-ct}
]
其中,$y$ 是时间 $t$ 内的平均日产奶量,参数 $a$、$b$ 和 $c$ 分别与泌乳高峰期、产犊到泌乳高峰的上升阶段以及泌乳高峰后的下降阶段相关。

2.6 人工蝴蝶优化(ABO)算法

ABO 算法用于估计 Wood 参数,其目标函数为:
[
o(F) = \text{Minimize } RMSE_{EMRY}
]
该目标函数旨在最小化每个农场平均日产奶量的均方根误差(RMSE)。在聚合产奶量以得到总日产结果时,使用所有记录的挤奶数据,无论上次挤奶后的间隔时间如何。

ABO 算法的步骤如下:
1. 初始化包含 $n$ 只蝴蝶 $b_i$($i = 1, 2, \ldots, n$)的种群 $P$。
2. 根据目标函数的背景确定每只蝴蝶 $b_i$ 的能力和动力强度。
3. 按能力对所有蝴蝶进行排序。
4. 选择能力较强的蝴蝶组成太阳斑蝴蝶(SB),其余组成冠层蝴蝶(CB)。
5. 对于每只 SB:
- 根据太阳斑飞行(SF)模式飞到一个新位置。
- 评估新位置的能力,并使用贪心选择策略选择实际位置和改进位置中的较优者。
6. 对于每只 CB:
- 根据冠层飞行(CF)模式飞到随机选择的一只 SB 位置。
- 计算适应度函数。
7. 如果适应度优于之前的位置,则使用贪心选择策略选择原始位置和新位置中的较优者;否则,根据自由飞行(FF)模式飞到新位置,公式如下:
[
x_{i}^{t + 1} = x_{i}^{t} + q_2 \cdot (x_c - x_{i}^{t}) \cdot f_i
]
其中,$x_{i}^{t}$ 是第 $i$ 只蝴蝶在时间 $t$ 的位置,$x_c$ 是当前最佳位置,$f_i$ 是第 $i$ 只蝴蝶的香味,$q$ 是范围在 $[0, 1]$ 的随机数。
8. 根据搜索公式找到三个参数。
9. 当所有节点都被定位时,算法停止。

2.7 ANN 预测模型

基于以下变量构建 ANN 模型:
- $x_1$ — 健康状况值(HCvalue)
- $x_2$ — 食物摄入能力(FIC)
- $x_3$ — 预期相对产奶量(ERMY)
- $x_4$ — 产犊年龄
- $x_5$ — 产犊月份
- $x_6$ — 泌乳次数
- $Y$ — 实际日产奶量

该模型由两个隐藏层组成,第一层和第二层分别有 10 个和 6 个神经元。它具有最佳的标准差比(SD 比),即预测误差的标准差与实际数据标准差的比值,并且在输入层和输出层之间具有良好的线性相关系数。

以下是整个预测流程的 mermaid 流程图:

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;

    A[开始]:::process --> B[数据收集]:::process
    B --> C[健康状况估计]:::process
    B --> D[食物摄入能力估计]:::process
    B --> E[预期相对产奶量估计]:::process
    C --> F[Wood 参数估计]:::process
    D --> F
    E --> F
    F --> G[ABO 算法优化]:::process
    G --> H[ANN 模型预测]:::process
    H --> I[结果评估]:::process
    I --> J[结束]:::process
2. 实验结果

将 ANN 分类器与 ABO 算法(ANN - ABO)的结果与 ANN - GA、传统 ANN 和 SVM 算法进行比较,评估指标包括灵敏度、特异性、准确率、阳性预测值(PPV)、阴性预测值(NPV)、马修斯相关系数(MCC)和 F1 分数。计算公式如下:
- 灵敏度 :$Sensitivity = \frac{No \ of \ TP}{No \ of \ TP + No \ of \ FN}$
- 特异性 :$Specificity = \frac{No \ of \ TN}{No \ of \ TN + No \ of \ FP}$
- 准确率 :$Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$
- PPV :$PPV = \frac{TP}{TP + FP}$
- NPV :$NPV = \frac{TN}{TN + FN}$
- MCC :$MCC = \frac{TP \cdot TN - FP \cdot FN}{\sqrt{(TP + FP)(TP + FN)(TN + FP)(TN + FN)}}$
- F1 分数 :$F1 - score = 2 \cdot \frac{precision \cdot recall}{precision + recall}$
其中,$TP$ 为真阳性,$TN$ 为真阴性,$FP$ 为假阳性,$FN$ 为假阴性,$precision = \frac{TP}{TP + FP}$,$recall = \frac{TP}{TP + FN}$。

实验结果如下表所示:
|性能指标|ANN - ABO|ANN - GA|ANN|SVM|
| ---- | ---- | ---- | ---- | ---- |
|灵敏度|0.7015|0.6421|0.6237|0.4534|
|特异性|0.9042|0.8625|0.8125|0.5011|
|准确率|0.9747|0.9218|0.8143|0.6273|
|PPV|0.7514|0.6516|0.6217|0.4634|
|NPV|0.8041|0.7725|0.7295|0.6211|
|MCC|0.7085|0.5332|0.4513|0.3946|
|F1 分数|0.7214|0.6156|0.5627|0.4456|

从结果可以看出,ANN - ABO 在各项指标上均表现出较高的准确性和性能,其准确率达到 97%,灵敏度为 70%,特异性为 90%,PPV 为 75%,NPV 为 80%,MCC 分数为 70%,F1 分数为 72%。

综上所述,基于机器学习的自动化模型在奶牛产奶量预测方面具有显著优势,ANN - ABO 算法在准确性和性能上优于其他比较算法。该模型考虑了奶牛的健康状况、食物摄入能力和预期相对产奶量等因素,通过 ABO 算法优化 Wood 参数,并使用 ANN 模型进行预测,为奶牛养殖决策提供了有力支持。

基于机器学习的奶牛产奶量预测模型研究

3. 模型优势与应用前景
3.1 模型优势分析

该基于机器学习的奶牛产奶量预测模型具有多方面的显著优势:
- 全面考虑影响因素 :模型综合考虑了奶牛的健康状况、食物摄入能力和预期相对产奶量等多个关键因素。在健康状况估计中,通过物联网传感器全面监测奶牛的心跳、体温、脉搏率、反刍值和呼吸值等多项健康参数,能够更准确地把握奶牛的身体状况对产奶量的影响。食物摄入能力的估计则结合了奶牛的年龄、胎次、泌乳期和妊娠期等因素,使模型能够更贴合实际情况。
- 先进的算法优化 :采用人工蝴蝶优化(ABO)算法对 Wood 参数进行估计,该算法通过不断迭代优化,最小化每个农场平均日产奶量的均方根误差(RMSE),从而提高了模型的预测精度。与传统的参数估计方法相比,ABO 算法具有更强的寻优能力,能够更快地找到最优参数组合。
- 强大的预测性能 :实验结果表明,ANN - ABO 算法在各项评估指标上均表现出色,准确率达到 97%,灵敏度为 70%,特异性为 90%等。与 ANN - GA、传统 ANN 和 SVM 算法相比,ANN - ABO 算法在数据分类和产奶量预测方面具有明显优势,能够为奶牛养殖决策提供更可靠的依据。

3.2 应用前景展望

该模型在奶牛养殖领域具有广阔的应用前景:
- 精准养殖决策 :通过准确预测奶牛的产奶量,农场主可以根据预测结果合理安排饲料供应、挤奶计划和奶牛的健康管理。例如,如果预测到某头奶牛的产奶量将下降,农场主可以提前调整饲料配方或进行健康检查,以提高奶牛的产奶性能。
- 资源优化配置 :模型能够帮助农场主优化资源配置,提高生产效率。根据产奶量预测,合理安排人力、物力和财力资源,避免资源的浪费和闲置。例如,在产奶高峰期增加挤奶设备和人员,在产奶低谷期减少不必要的投入。
- 行业智能化发展 :该模型的应用将推动奶牛养殖行业向智能化方向发展。随着物联网、大数据和人工智能技术的不断发展,奶牛养殖将实现自动化、智能化管理。该模型作为智能化管理的重要组成部分,将为行业的转型升级提供有力支持。

4. 总结与建议
4.1 总结

本文提出了一种基于机器学习的自动化模型来预测奶牛产奶量。该模型综合考虑了奶牛的健康状况、食物摄入能力和预期相对产奶量等因素,通过人工蝴蝶优化(ABO)算法优化 Wood 参数,并使用人工神经网络(ANN)模型进行预测。实验结果表明,ANN - ABO 算法在准确性和性能上优于其他比较算法,为奶牛养殖决策提供了有力支持。

4.2 建议

为了进一步提高模型的性能和应用效果,提出以下建议:
- 数据的持续更新与扩充 :随着奶牛养殖环境和管理方式的不断变化,模型需要不断更新和扩充数据。收集更多的奶牛健康数据、产奶数据和环境数据,以提高模型的适应性和准确性。
- 多模型融合 :可以尝试将该模型与其他相关模型进行融合,如奶牛疾病预测模型、饲料配方优化模型等,以实现更全面的奶牛养殖管理。
- 实际应用验证 :在实际奶牛养殖场中进行大规模的应用验证,收集更多的实际数据和反馈信息,对模型进行进一步的优化和改进。

以下是模型应用流程的 mermaid 流程图:

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;

    A[数据收集与预处理]:::process --> B[模型训练]:::process
    B --> C[产奶量预测]:::process
    C --> D[养殖决策制定]:::process
    D --> E[资源配置调整]:::process
    E --> F[奶牛养殖管理]:::process
    F --> G[数据反馈与更新]:::process
    G --> A

总之,基于机器学习的奶牛产奶量预测模型为奶牛养殖行业带来了新的机遇和挑战。通过不断优化和完善模型,将其更好地应用于实际生产中,有望提高奶牛养殖的经济效益和社会效益,推动奶牛养殖行业的可持续发展。

以下是模型应用过程中的关键步骤列表:
1. 数据收集与预处理 :收集奶牛的健康数据、产奶数据、饲料数据和环境数据等,并进行清洗、转换和归一化处理。
2. 模型训练 :使用预处理后的数据对 ANN - ABO 模型进行训练,调整模型参数,提高模型的预测精度。
3. 产奶量预测 :将新的数据输入到训练好的模型中,预测奶牛的产奶量。
4. 养殖决策制定 :根据产奶量预测结果,制定合理的养殖决策,如饲料供应、挤奶计划和健康管理等。
5. 资源配置调整 :根据养殖决策,调整人力、物力和财力资源的配置,提高生产效率。
6. 奶牛养殖管理 :实施养殖决策和资源配置调整,对奶牛进行科学的养殖管理。
7. 数据反馈与更新 :收集养殖过程中的数据,反馈给模型,对模型进行更新和优化。

通过以上步骤的循环执行,不断提高模型的性能和应用效果,实现奶牛养殖的精准化和智能化管理。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值