数据平滑与功能数据分析:从残差评估到功能描述
在数据平滑处理之后,我们需要评估数据的拟合情况,并进一步分析残差,同时了解相关的功能类和函数的使用方法,以及进行一些实践尝试。
评估数据拟合情况
在完成数据平滑后,有许多问题值得探讨,这引导我们对残差 (r_{ij} = y_{ij} - x_i(t_j)) 进行进一步分析。这些分析可以是功能性的,因为有理由认为这些残差在 (t) 上的部分变化是平滑的。
首先,我们要思考是否因过度平滑而遗漏了数据中的重要特征。例如,可能有一两条曲线存在异常情况,但由于广义交叉验证(GCV)准则选择了对所有样本同时最优的平滑水平,导致我们未能发现。那么,分别对每个气象站的对数降水量数据进行平滑处理是否会更好呢?这个问题我们将在后续进一步探讨。
另一个相关问题是,残差的变化是否符合我们所采用的平滑类型的隐含假设。只有当所有时间点的残差都呈正态分布,并且这些残差的方差在不同年份和气象站(曲线)之间保持恒定时,使用无加权最小二乘法准则才是最优的。
接下来,我们回到之前考虑的对数降水量数据,创建一个 365×35 的残差矩阵。然后,我们用这个矩阵创建跨气象站和跨时间的方差向量:
logprecmat = eval.fd(day.5, logprec.fd)
logprecres = logprecav - logprecmat
# 跨气象站
logprecvar1 = apply(logprecres^2, 1, sum)/35
# 跨时间
logprecvar2 = apply(logprecres^2, 2, sum)/(365-12)
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



