机器学习(machine learning)的回归分析基本思路是通过收集训练集的特征(x),采用某种函数去拟合训练集目标值(y), 希望通过拟合的方式预测/评估尚未遇到样本(x’)的目标值。回归分析更严谨的数据定义[2]:
- 给定一些未知/待求解变量(向量)
β- 基于一些相互独立的变量 (向量)
X- 希望找到应变量y与未知变量 \beta和独立变量x的函数关系
Y≈f(X,β)
具体的应用场景如广告系统的在线流量预估(进行在线流量分配以确保合约式保量展现),通过流量的预估可以最优化广告系统收益。在大部分的回归分析中,未知变量的求解大多通过优化目标函数来已完成,
min∑i=0n(yi−f(xi,β)