机器学习预测的关键方法与流程
1. 机器学习基础认知
机器学习并非仅仅是熟悉几个工具包,更需要理解并实践开发可部署模型的过程。它需要具备本科基础数学、概率和统计的基本知识,但不要求有机器学习背景。重点在于掌握解决各类问题的优秀算法,而非全面涉猎所有机器学习算法。一些算法虽有趣但使用不频繁,可能是因为扩展性不佳、难以洞察内部机制或使用难度大等。例如,梯度提升算法在在线机器学习竞赛中表现出色。
2. 构建机器学习问题框架
2.1 问题转化
当面对一个机器学习问题时,如“让我们取得更好的结果”这样的笼统表述,需先转化为可衡量和优化的具体目标。以网站所有者为例,具体目标可能是提高点击率、增加销售额或提升贡献利润率。
2.2 数据收集
接下来要收集数据,用于预测客户点击链接或购买产品的可能性。这些数据可表示为属性矩阵,如网站访客过去浏览的页面或购买的商品。同时,机器学习算法还需要正确答案(即目标值)进行训练,避免单纯记忆过去的行为。
2.3 问题迭代
问题的多个方面通常有多种解决方式,因此在构建问题、选择和训练模型以及评估性能之间会存在迭代过程。例如,构建自动证券交易系统时,预测证券价格变化的方式有多种,如计算当前价格与未来10分钟、10天价格的差值,或与未来10分钟内最大/最小价格的差值,还可以用“更高”或“更低”的二态变量表示。需要通过实验确定最佳选择。
以下是这个过程的mermaid流程图:
graph LR
A[定性问题描述] --> B[数学问题描述
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



