ddl是第一生产力有了科学解释,网友:给大模型试试

西风 发自 凹非寺
量子位 | 公众号 QbitAI

到年底了,大学生碰上期末周、打工人在赶KPI,没有deadline(ddl)的年底不是真年底……

308f89a76033e953aed7c057a4e36b42.jpeg

ddl在我们的日常生活中普遍存在,“ddl是第一生产力”更是人们通过亲身实践得出的“至理名言”。

4aa745480c1cdfc0b920de6582a31089.jpeg

然鹅,关于ddl行为效应的系统证据却很少见。

不过,运筹学和管理科学领域最大的专业协会之一INFORMS旗下期刊《Management Science》上,就刊登了一项关于ddl的研究。

19bcd990131d218d077c26e3f41f833b.png

该研究通过两项实验证实了ddl的有效性,给出了ddl是一种强有力的管理工具的研究解释,并揭示了个体对ddl的反应受到记忆和注意力限制的影响。

有学者评价道:

了解不同协调方法之所以有价值,是因为它们充分考虑到了人类的认知限制,这是一个有趣的课题。
未来,我们与AI的交互设计将着眼于弥补人类心理上的限制。显而易见,当前的聊天界面是不完善的,因为它们错误地假设了人类能像LLM一样处理和记忆相同量级的上下文信息。

614db03bd202fb98de0c39a99252dc14.png

网友们也是脑洞大开,“给大模型设置ddl,会不会提高它的性能?”:

e0425af101a65b5d53651e98a6b13cc6.png

考古「ddl有效」实验

这项研究由来自德国IZA Bonn研究所、哥本哈根大学、赫蒂学院、凯泽斯劳滕大学的研究人员共同完成。

他们在一家大型牙科诊所进行了两项实验,目标人群是那些需要做预防性检查的患者。选择这个场景做实验,主要是考虑到:

按医嘱,患者应定期主动联系牙医,预约检查(检查频率相对较低),也就是人们需要主动完成任务,但没有明确的执行日期。这个设置就特别适合探讨ddl、任务表现和记忆限制之间的相互作用。

fa8d84be95e75b68388631a29f50f40b.png

具体来说,第一个实验时间跨度为2011-2013年。

牙科诊所的检查预约通知系统会按照患者的建议检查时间间隔,向患者发送一张明信片式的提醒通知,提醒他们预约下一次的常规检查。

9c35fe28d5282f4608b86f86d395e334.png

在这个基础上,研究人员在提醒通知中加入了ddl,对应三个治疗组:D1(1周ddl)、D3(3周ddl)、ND(无ddl)。在每个治疗组中还设置了3种奖励水平:大奖励(免费专业牙齿清洁)、小奖励(牙护套装)、无明确奖励。

这样就构成了3种ddl×3种奖励水平的9种组合。

6763fe59a89e1befa65e35d6b5bc39d6.png

被试共有1175名患者,来自1015个家庭,共产生了2661次的治疗。研究人员在2011-2013年时间段内分43批次随机分配患者进入不同治疗组。

分析结果变量主要是患者首次联系预约的日期、累积响应率、在ddl内的响应率、每日风险率(Hazard Rate)。

在2013年的第二季度、第三季度,研究人员在同一环境下设置了第二次实验,主要是为了探究关键发现在更长的ddl下是否稳定。

作为对照,除了与主实验中的D1、D3和ND相对应的处理,第二次实验还包括了一个为期6周(D6)、10周(D10)和截止到12月31日的“年终”(EoY)ddl处理。奖励是价值10欧元的牙护套装。

7d42bdaf978b71b3c7057d85782ae3a0.png

其他设计和分析流程与第一个实验类似。

ddl的威力

最终研究人员对实验结果进行了分析,分析过程有点复杂,感兴趣的家人们可以查看完整论文,“省流版”如下。

  • 设置ddl可以显著提高和加速人们对任务做出反应的频率和时间。

0e25f3d42551032e6db24a1e2719988a.png
b383232fade8351185c07d23004db415.png

  • 相对较短的ddl(1-3周)不仅可以加速人们的反应,还可以在ddl后100天内持续使响应率升高10%以上,持续提高人们更长时间内的任务完成率,这可能与记忆和注意力的限制有关。

  • 即使没有明确的奖励措施,ddl对人们的行为也有显著影响,ddl本身效果与高额奖励的效果近似。

72f76573aad3acc85183298558a305a9.png

  • 在给定ddl前,风险率随着ddl的延长而降低,这与理论预测不符,也可能是记忆限制的影响。

也就是ddl较长,人们有可能遗忘之前要完成的任务,导致风险率相对较低。

1d697421c4e792ca9fa0e9cc6eb35d64.png

  • 将奖励和合理的短期ddl结合起来,能以更低的总成本激励人们提早完成任务,成本效益最高。

968ed4b5fb54965b9a4a476bfc44282a.png
f59a91982d0032e9a92d1ba39bf1a7bb.png

  • 对一个任务施加ddl可能会对其他任务产生负面溢出效应。

  • 在无ddl设置中响应率较低的群体,在施加ddl后任务表现相对提升更大。

3b3bb3f18977295aaf597c0d8b5149ca.png

网友热议

沃顿商学院教授Ethan Mollick扒出并分享了这项研究后,得到不少网友关注。

0840003584c2eb178aad4954a64c5147.png

有网友表示,“这和帕金森定律相呼应”(工作会膨胀以填满用于完成该工作的时间):

较短的ddl增加了紧迫感,但也更安心,因为知道在ddl来临之前仍有时间纠正错误或补救问题。

e809e715cbe223685d638957514f0b96.png

从研究出发,有网友还对ddl对心理的长期影响以及工作质量的影响感兴趣:

ddl本质上仅是一个时间框架,它设定了完成任务时可进行的分析的范围和深度。然而,人们常常将面对ddl的压力视为是一种惩罚。

a905faf9fd9839988b55f834e7dec76c.png

此外,也有网友吐槽ddl:

你确定这不是因为囚犯习惯了牢笼铁栅栏吗?没有ddl的情况下,我工作得更好。

7db3195ba09fa9348a111057e089bedc.png

参考链接:
[1]https://x.com/emollick/status/1743464038716027107?s=20
[2]https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2021.4227

—  —

点这里👇关注我,记得标星哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值