回归和插值实现的功能都是用来拟合给定的一系列点:
points = {(x1,y1),(x2,y2)...(xn,yn)}
区别在于:
插值:拟合出来的函数曲线需要通过给定的初始点,实现已知函数的初始点,需要知道这些点以外的点的取值的功能,从局部出发。
回归:不需要通过给定的所有初始点,只需要拟合一条‘差不多’的曲线即可,更具有全局性,依赖于初始经验模型的设置,如多项式,逻辑回归等。
所以回归方法主要用在处理实验中采集得到的数据,揭露实验数据内部信息的功能;而插值方法是起源于数据计算,用于已知的数据点是绝对准确的情况。
多项式回归和样条(spline)的区别
多项式是一个完整的来拟合所有数据点,不进行分段,力求反应数据的全局属性;
spline是使用多分段来控制高次多项式,同时具有更好的局部特性,因为分段处理了所以控制了模型的复杂度。但是每一个区间只与相邻的区间有关系,遥远的数据点对该区间没有产生影响,这种方式可能存在信息利用不完全的问题。