机器学习实战:从体育社交网络到现实挑战
1. 体育社交网络的MLOps项目
在体育社交网络领域,利用有机的“增长黑客”策略来推动平台发展是一个极具挑战性的任务。起初,通过机器学习反馈循环,平台成功吸引了数百万的月活跃用户。然而,Facebook法律团队的通知给项目带来了阻碍,原因是平台创建了带有自身链接的独特体育内容。
1.1 系统工作流程
- 用户发布原创内容,平台将其跨发布到Twitter和Facebook等社交网络。
- 收集平台产生的页面浏览量,将其作为机器学习预测系统的目标。
- 收集用户的社交媒体信号,如中位数转发、中位数点赞和维基百科页面浏览量,作为特征,以过滤虚假数据。
- 根据用户在平台上产生的参与度向原创内容创作者支付费用。
graph LR
A[用户发布原创内容] --> B[跨发布到社交网络]
B --> C[收集页面浏览量]
C --> D[作为ML预测系统目标]
A --> E[收集社交媒体信号]
E --> F[作为特征过滤虚假数据]
D --> G[支付内容创作者费用]
1.2 数据标注挑战与解决方案
最初收集数千名“名人”社交媒体用户的手柄信息时遭遇失败,原因是实习生缺乏可靠输入的训练,容易导致信息错误。为解决这一问题,引入了亚马逊Mechanical Turk进行自动化处理。训练一组“Turker”来查找运动员的社交媒体手柄,当7/
超级会员免费看
订阅专栏 解锁全文
1777

被折叠的 条评论
为什么被折叠?



