机器学习项目的规划与范围界定:从实验到实施
1. 原型实验的风险与应对策略
在进行模型实验时,如果没有提前规划好原型筛选,会面临诸多风险。例如,团队A在模型实现过程中,没有对初始模型进行评估,在实现第一个关键特性时花费了大量时间,而在转向第二个关键特性时,发现无法在演示会议前完成,导致之前投入到SVD模型的工作付诸东流。另外两个团队由于人员不足,也未能完成第三个关键特性,最终三种方法都无法满足项目的关键需求,还影响了其他工程团队。
正确的做法是像原型实验部分那样,团队提前与业务部门沟通,告知关键特性暂时无法实现,先根据测试中各模型类型的原始输出做出决策。选定单一方案后,将整个机器学习团队的资源和时间集中在实现最低要求的特性上,并在核心解决方案展示期间增加检查演示,以确保方向正确。尽早且频繁地进行演示,即使特性尚未完全实现,也有助于最大化人员资源的利用,并从主题专家(SME)那里获得有价值的反馈。
2. 实验范围界定:设定期望和边界
在完成推荐引擎的规划后,我们了解了对业务重要的细节、用户对推荐的期望以及项目各阶段的里程碑计划,接下来就需要规划研究工作。由于相关信息无穷无尽,但时间有限,因此需要设定实验范围,明确测试内容和方法。
团队在与SME团队进行适当的探索会议后,应明确需要构建的关键特性:
- 对产品库存进行去重。
- 纳入基于产品的规则,对每个用户的隐式偏好进行加权。
- 根据产品类别、品牌和特定页面类型对推荐进行分组,以满足网站和应用上不同的结构化元素。
- 采用一种不会产生高昂运行成本的算法来生成用户与物品之间的亲和力。
列出MVP的绝对关键方面后,团队可以开始规划解
超级会员免费看
订阅专栏 解锁全文
1034

被折叠的 条评论
为什么被折叠?



