混料实验设计优化配方

第13章 混料实验设计

史蒂夫在研发领导团队会议上开场时,自豪地谈到了玛丽亚刚刚完成的实验设计(DOE)工作所带来的价值。实验设计是一种前所未有的强大方法。玛丽亚的工作不仅帮助工厂实现了更稳定的烧烤酱黏度,而且这种系统性方法还加深了对蒸汽压力和生产线速度等因素如何影响粘度的理解。史蒂夫心中已有多个改进机会,并希望通过对这些机会应用实验设计方法,也能取得同样积极的结果。

几天后,玛丽亚接到了采购经理之一亚当的电话。由于原材料短缺,基础烧烤酱中使用的三种淀粉之一的成本大幅上涨,价格现在几乎是其历史平均水平的三倍。

亚当:“我们希望在产品中使用一种不同的淀粉,以避免成本增加。我们的淀粉专家乔已经确定了一种潜在的替代方案。你能用这种替代淀粉替换当前高成本淀粉吗?”
玛丽亚:“我们需要进行一些实验来回答这个问题。我将联系研发团队制定一项研究计划,然后回复您。”

玛丽亚开始与史蒂夫讨论这个问题。史蒂夫提到,过去曾对这种替代淀粉进行过一些研究,结果表明它不能直接替换当前的淀粉混合物。之前的开发工作显示,如果简单地以一对一的方式替换淀粉,最终产品的粘度将不够。不过,可能通过将这种新淀粉与其他淀粉进行混合,从而达到所需的产品粘度。

玛丽亚:“所以,我们需要找出最佳的三淀粉混合物。”
史蒂夫:“我们能使用过去用来优化粘度的实验设计方法吗?”
玛丽亚:“这正是我在想的。但这里有一个很大的不同,三种淀粉在配方中的总和是一个固定百分比。我记得在我的实验设计课程中提到过混合物设计。”

这些情况会使用设计。我得查看一下我的课堂笔记,才能回忆起有关这种方法的更多细节。

玛丽亚当天晚些时候有时间查看她的笔记,然后在史蒂夫的办公桌找到了他。

玛丽亚:“我想我有一些关于如何解决这个问题的想法。我们真正关注的是三种淀粉的最佳比例混合。这类似于调制鸡尾酒。我将以玛格丽塔为例。”
史蒂夫:“那是我最喜欢的之一!”
玛丽亚:“玛格丽塔的经典配方是两份龙舌兰酒、一份青柠汁和一份三重奏橙酒。这相当于50%龙舌兰酒、25%青柠汁和25%三重奏橙酒。但也许,这三种成分的另一种比例混合味道会更好,比如稍微少一点龙舌兰酒,再多一点三重奏橙酒。不过,这些比例总和始终为100%。每种混合方式都是一次不同的试验运行。”
史蒂夫:“我目前都跟得上。”
玛丽亚:“在混料设计中,我们可能会有某个组分占100%而其他组分占0%的试验运行。这样调出的玛格丽塔口感会非常糟糕。因此,对于玛格丽塔,我们会有一些约束,例如龙舌兰酒需要在40%到60%之间,青柠汁在20%到30%之间,三重奏橙酒也是如此。也许我们的淀粉混合物没有这样的约束。但我们是否有可能只使用一种淀粉?”
史蒂夫:“这是个很好的问题。我不确定我们的烧烤配方是否真的需要三种淀粉;这只是我记忆中一直以来的制作方式。既然我们现在要更换一种新的淀粉,很可能并不清楚具体需求。如果我们能用两种甚至一种淀粉就做出优质产品,那将简化流程和原料线,也能让采购部的亚当高兴。也许这些淀粉存在一些约束条件,比如其中一种不能超过50%,另一种必须不少于30%但不超过50%。这方面乔会更了解,可以告诉我们具体情况。”

玛丽亚走近史蒂夫办公室里的白板并开始画图。

玛丽亚:“让我帮你直观地了解三种淀粉的设计空间会是什么样子,以及当我们添加约束时它将如何变化。三种组分的混合物可以用三元相图来表示。三元相图看起来像这样:”

在图中,任何三种淀粉的混合物都可以被表示出来,且三种淀粉的总含量等于100%。三角形的三个角代表仅含一种淀粉的样本:顶部的角代表100%的淀粉1,左角代表100%的淀粉2,右角代表100%的淀粉3。图上各面的刻度线朝特定方向延伸,表示淀粉混合物中各组分的含量。

三角形边的中点代表该边上两个组分的50/50混合物。在下一张图中,三角形各边中点处的点已被添加。该三角形右边中点处的点是淀粉1和淀粉3的50/50混合物。底边中点处的点是淀粉2和淀粉3的50/50混合物。左边中点处的点是淀粉1和淀粉2的50/50混合物。

在下一张图中,三角形中点处的点是三种淀粉的33/33/37混合物。如同在优化设计中一样,它是设计空间中的中心点。

如果我们在任一淀粉上添加约束,设计空间将会改变。下图说明了淀粉1不能低于40%的情况。这意味着其他淀粉不能超过60%。设计空间之外的区域被加深显示。

如果三种淀粉都有约束,使得每种淀粉的取值都不能超过或低于某些参数,则设计空间将受到约束。在下一张图中,淀粉1必须小于80%,淀粉2必须小于70%,淀粉3必须小于50%。

史蒂夫:“哇,我从没想过一个简单的三角形就能帮助我直观地看到混合空间以及任何可能存在的复杂约束。我们需要弄清楚是否真的需要这三种淀粉,以及其中任何一种是否存在约束。”
玛丽亚:“我们给乔打个电话,看看他怎么说。”

乔在第三声铃响前接起了电话。
乔:“嗨,史蒂夫,你最近怎么样?”
史蒂夫:“你好,乔。我很好,谢谢关心。玛丽亚现在在我办公室,我们一直在讨论我们的烧烤淀粉混合物。”
玛丽亚:“乔,你建议用一种新的淀粉来替代我们配方中成本增加的淀粉,用于烧烤酱,我们需要你帮忙回答几个问题。你认为使用一种或两种淀粉是否足以匹配当前粘度,而不必使用三种淀粉?另外,关于淀粉范围,你有什么顾虑吗?我们需要注意哪些约束?是否有一些特定的淀粉范围,我们必须在其中操作?”

乔:“说实话,任何情况都有可能。双淀粉混合物或许就足够了,尽管我们几年前做的研究显示可能需要三种淀粉。然而,基于之前的研究,并且由于我们尚未使用过这种新淀粉,我认为仍有简化我们原料线的机会。至于淀粉限制,我建议考虑所有可能性,因为我们没有理由要增加或减少某一种淀粉的用量。请告诉我你了解到的情况,如果还有其他问题,随时联系我。”
史蒂夫:“谢谢乔。祝你有美好的一天。”
乔:“你也是,祝你本周剩余时间高效顺利。”

玛丽亚:“听起来我们应该考虑所有可能性。我将在整个0–1范围内设置设计。”
史蒂夫:“你的意思是0–100%范围吗?”
玛丽亚:“是的。这个范围可以有两种表示方式:如果是比例,则为0–1;如果是百分比,则为0–100%。我将使用比例。我们可用的设计如下所示:”

史蒂夫:“我记得你在之前的实验中,在中心点重复了试验运行。如果这次你也这样做,我们只需要创建八个样品来评估三种淀粉?这听起来数量太少了!我们是不是遗漏了什么?你之前的实验设计需要16次运行,才能充分理解成分的线性和非线性效应及其交互作用。”
玛丽亚:“你说得对,你的记性很好。在混料设计中,当三个因子水平中有两个已知时,第三个也就确定了,因为它们的总含量为100%。我们使用的模型形式与因子完全独立时所用的不同,因此这种较少的试验次数就足够了。”
史蒂夫:“混料设计与响应面设计相似,却又截然不同。一方面,其思路是相同的,但另一方面,设计的结构以及设计空间的可视化则完全不同。幸运的是,我们不需要制备和评估16个样品来研究三种淀粉,而只需制备和评估8个样品,因为我们关注的是这三种淀粉的最优配比。”

玛丽亚设置了设计试验。与她之前的设计一样,她决定以随机顺序进行试验。她的设计如下所示:

样本 S1 S2 S3 Cost
1 0.33 0.33 0.33 0.32
2 1.00 0.00 0.00 0.25
3 0.00 0.00 1.00 0.30
4 0.50 0.50 0.00 0.33
5 0.00 1.00 0.00 0.40
6 0.33 0.33 0.33 0.32
7 0.00 0.50 0.50 0.35
8 0.50 0.00 0.50 0.28

乔向玛丽亚提供了单一淀粉的成本,她可以轻松确定任何淀粉混合物的成本。如果存在多种符合粘度目标的混合物,这些信息将有助于确定最佳的混合物。

所有团队成员都参与了这项新设计。康妮将负责生产线,但由于操作条件没有变化,她不需要额外帮助。玛丽亚将确保在配料混合阶段加入不同的淀粉混合物。亚历克斯将在生产线运行期间再次收集10个瓶子,与之前的实验一样设置因子,从五个灌装头中的每一个抽取两份样品。查德将再次亲自进行粘度测量,以确保他们的实验不会干扰质量实验室的日常操作。

设计执行日再次非常繁忙,但由于团队在执行方面经验更加丰富,进展顺利。查德完成所有样品的测量后,将数据提供给了玛丽亚。

样本 V01 V02 V03 V04 V05 V06 V07 V08 V09 V10
1 3654 3666 3639 3662 3645 3648 3655 3659 3656 3645
2 5026 5036 5026 5041 5007 5043 5024 5038 5031 5031
3 4177 4167 4146 4153 4167 4154 4147 4158 4145 4138
4 4576 4605 4593 4584 4581 4562 4572 4559 4567 4579
5 4278 4315 4292 4293 4286 4262 4298 4278 4291 4287
6 4371 4390 4383 4396 4395 4391 4399 4396 4395 4405
7 4369 4365 4383 4374 4381 4375 4371 4364 4379 4395
8

玛丽亚再次通过为每次实验运行的10个独立黏度创建直方图来启动数据分析过程。

玛丽亚发现各样品的测量值变化相似,且没有出现偏斜或异常高低的测量值。与之前一样,她计算了八次设计运行的粘度测量值的平均值、范围和标准偏差,并将其整理成表格。

样本 粘度平均值 范围 标准偏差
1 4298 30 10
2 3653 27 8
3 5030 36 10
4 4155 39 12
5 4578 46 14
6 4288 53 14
7 4392 34 9
8 4376 31 9

确认各试验运行的范围和标准偏差没有显著差异,并查看了平均粘度后,她迫切希望开始建模过程。她首先在设计点处根据试验运行的平均粘度创建了一个三元相图。

在图中可以明显看出,单独使用淀粉3得到的产品最稠,因为该设计点的粘度平均值最高。同样,单独使用淀粉2得到的产品最稀,因为该产品的粘度平均值最低。所有平均粘度均未恰好达到她的目标值4300,但有两个位于中点的设计点非常接近该目标值,其他几个也较为接近与目标相差不远。玛丽亚希望该模型能揭示出多种预测可达到目标的淀粉混合物。

玛丽亚回想起她的实验设计课程的课堂笔记,混料设计的模型与通常用于筛选和响应曲面设计的回归模型略有不同。对于她的混料,模型包含了三种单一淀粉的效应以及三对淀粉之间的交互作用项。模型中去除了截距,并且不包含平方项,这也称为谢费模型。

玛丽亚将此模型拟合到她的实验数据中。

拟合摘要

R方 调整R方 均方根误差 响应均值 观测值(或权重和)
1.00 1.00 16.03 4346.25 8.00

方差分析

来源 DF 总和平方 均方 F比率 概率 > F
模型 5 1046580 209316 814.8 <.0001*
误差 2 514 257
校正总和 7 1047094

与简化模型进行检验:Y=均值

排序后的参数估计

| Term | 估计 | 标准误 | t比值 | Prob>|t| |
|----------|----------|--------|--------|---------|
| S3 | 5027.75 | 15.94 | 315.42 | <.0001 |
| S2 | 4575.75 | 203.03 | 287.06 | <.0001
|
| S1 | 3650.75 | 183.03 | 229.03 | <.0001 |
| S2
S3 | -1602.97 | 71.01 | -22.57 | <.0001 |
| S1
S2 | 2.86 | 71.01 | 2.58 | 0.0020 |
| S1
S3 | 2.58 | 71.01 | 2.86 | 0.1037 |

她的软件输出结果再次与之前的设计输出相似。玛丽亚惊讶地发现,她模型的R‐平方为1.00——完全拟合!仔细查看后,她发现实际值是0.9996,她的软件在输出时将其四舍五入为1.00。这表明该设计的执行效果非常好,可能归因于团队对该工艺的经验,以及调整成分混合物比调整工艺参数更容易控制。

模型中的单个淀粉效应对应于仅使用每种淀粉时的粘度含量。淀粉2与淀粉3的交互作用极为显著,其p值远小于0.05。玛丽亚不确定如何解释这一点,除非借助某种可视化方式。另外两个交互作用的p值均高于0.05。由于该模型已经非常合适,因此她认为通过删除这些项来优化模型不会影响她的解释和预测,所以她没有为此设计付出这样的努力。

她的软件对她的模型进行了可视化,帮助她理解三种淀粉的影响。其中一个是轮廓图,显示在保持其他两种淀粉比例不变的情况下,增加或减少任一种淀粉的影响。该轮廓图如下所示:

在此图中,每种淀粉在混合物中的比例相等,均为0.33。该混合物的预测粘度为4284,并且还显示了此预测的95%置信区间。玛丽亚可以看到,在保持另外两种淀粉比例相等的情况下,增加淀粉1的比例会使粘度降低;而在保持另外两种淀粉比例相等的情况下,增加淀粉3的比例会使粘度升高。对于淀粉2,效果类似,但粘度的增加幅度要小得多。

第二个可视化图是三元空间的等高线图。玛丽亚创建了该图,使其显示粘度目标为4300的等高线,其他等高线以200为增量。该图如下所示:

玛丽亚发现,有许多混合物的预测粘度为4300,其中包括位于三角形边上的两种仅由两种淀粉组成的混合物。在三角形的左侧,35%的淀粉1和65%的淀粉2的混合物预计可达到此目标。在三角形的右侧,56%的淀粉1和44%的淀粉3的混合物也预计可达到此目标。

玛丽亚现在创建了一个在三元空间中显示混合物成本的可视化图。她以0.02为间隔显示等高线。由于这些等高线是直线,她移除了图上的参考线,以便更清晰地看到成本等高线。带有配方成本等高线的图如下所示:

玛丽亚发现,从三角形的下角向上移动时,成本降低。这是合理的,因为淀粉2是最贵的,而朝这个方向移动会减少该淀粉在混合物中的含量。结合黏度预测信息,她确定56%淀粉1和44%淀粉3的混合物是满足其目标的最低成本混合物。

与她的其他设计一样,玛丽亚通过分析残差来验证她的模型是否遗漏了任何关键内容。如果她将残差对实验运行顺序和模型的预测值进行绘图,残差中不应存在任何模式,并且应遵循以零为中心的正态分布。她再次创建图来执行此评估。

玛丽亚从这些图表中没有发现任何迹象表明她的模型未能充分描述因素效应对粘度的影响。她正好在史蒂夫的办公桌旁找到了他,并向他分享了建模结果。

史蒂夫:“这是一个非常好的结果。我们不仅降低了当前配方的成本,而且在混合物中仅使用两种淀粉也简化了生产。”
玛丽亚:“尽管我对我们的模型,比如响应面模型很有信心,但验证模型预测仍然很重要。我认为我们应该进行四次验证试验,其中两次混合物在4300的目标值处,另外重复实验中的两次实验运行。这是我们之前采用的方法。”
史蒂夫:“我同意。让我们使用低成本的双淀粉混合物,以及一种成本与当前产品相近的三淀粉混合物,这两种混合物均预测可达到目标。从设计中选取两种粘度范围更广的混合物。”

根据这一指导,玛丽亚为验证研究提出了以下试验方案:

运行 S1 S2 S3 成本 观测粘度 来自设计 预测 粘度
1 1.00 0.00 0.00 0.25 3656 3651
2 0.56 0.00 0.44 0.27 5025 5028
3 0.40 0.20 0.40 0.30 4302
4 4303

史蒂夫同意该计划,并与康妮、亚历克斯和查德安排了下周执行这些试验的时间。

玛丽亚在执行后不久收到了查德发来的粘度数据。

运行 V01 V02 V03 V04 V05 V06 V07 V08 V09 V10
1 3658 3634 3652 3634 3653 3656 3642 3663 3652 3642
2 5026 5007 5012 5022 5022 5034 5025 5048 5024 5033
3 4292 4326 4300 4282 4287 4300 4295 4309 4284 4294
4 4306 4297 4312 4317 4300 4317 4311 4323 4292 4317

玛丽亚再次开始创建按运行划分的数据分布。

她未发现各次运行结果的分布存在显著差异。与之前一样,她还计算了各次运行的范围和标准偏差。因此,汇总统计如下所示:

运行 平均值粘度 范围 标准偏差
1 3649 29 10
2 5025 41 11
3 4297 44 13
4 4309 31 10

玛丽亚认为这些变异的汇总度量之间没有显著差异,现在她有信心可以将运行平均值与模型预测值以及设计中的前两个观测值进行比较。她将这些均值添加到之前的表格中,表格现在如下所示:

运行 S1 S2 S3 成本 观测粘度 来自设计 预测 粘度 观测验证 粘度
1 1.00 0.00 0.00 0.25 3656 3651 3649
2 0.56 0.00 0.44 0.27 5025 5028 5025
3 0.40 0.20 0.40 0.30 4302 4297
4 4303 4309

很明显,结果验证了预测,56%的淀粉1和44%的淀粉3的混合物可以使用。玛丽亚向史蒂夫分享了验证结果。

史蒂夫:“玛丽亚,这真是个好消息。如果我们不得不继续使用现有的淀粉混合物,我们的配方成本将增加一倍以上,达到0.63美元。我们将不得不把这种更高的原料成本转嫁给消费者,或者大幅压缩我们的利润。由于你们团队的出色工作,我们现在可以宣布,每瓶产品将节省几美分,而不是面临提高烧烤酱零售价的尴尬局面。你们的混料设计真是太棒了!”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值