有轨电车延误预测模型:部署、优化与拓展
1. 模型部署与维护
1.1 模型再训练频率考量
在一个良好的开发环境中,从下载最新原始数据到部署更新后的模型,整个端到端的过程不到一小时。鉴于此低成本,可以每月对模型进行再训练,但这是否有必要呢?之前的数据探索显示,有轨电车延误存在一些长期趋势,如延误时间变短但频率增加,且各月之间没有巨大波动。因此,每季度刷新一次模型或许就足够了。不过,为确保准确性,需要通过将预测结果与新月份的实际延误数据进行比较来监控模型。
1.2 模型训练实验
可以尝试仅使用近期数据来训练模型,例如采用三年滚动窗口的训练数据,而非使用自 2014 年 1 月以来的整个数据集。
1.3 用户反馈收集
为用户提供直接反馈终端应用体验的方式也很重要。部分用户的直接反馈能够揭示监控过程中被忽略的模型问题。
1.4 模型部署方式
- 简单 Web 部署 :可以使用 Python 的 Flask 网络框架库和一组 HTML 页面实现模型的最小化部署。用户在网页中输入有轨电车行程的详细信息,即可获得行程是否会延误的预测结果。背后的原理是,训练好的深度学习模型根据行程细节生成预测,并将其准备好显示在网页上。
- Facebook Messenger 部署 :若想提供更流畅的用户体验,可以结合 Rasa 聊天机器人框架和 Facebook Messenger 来部署训练好的深度学习模型。部署完成后,用户可以在 Facebook Messenger 中向聊天机器人发送
超级会员免费看
订阅专栏 解锁全文
927

被折叠的 条评论
为什么被折叠?



