功能数据分析入门:概念、方法与应用
1 功能数据的定义与示例
1.1 什么是功能数据
1.1.1 女孩成长数据
女孩成长数据是功能数据的典型示例。在伯克利成长研究中,记录了 10 名女孩在 31 个不同年龄点的身高。这些年龄点并非等间距分布,在孩子 1 岁时进行 4 次测量,2 到 8 岁每年测量一次,之后每两年测量一次。尽管测量过程严谨,但身高值仍存在至少 3 毫米的平均不确定性。
虽然每个记录是有限的数值集合,但这些数值反映了身高的平滑变化,本质上可看作是一个身高函数。因此,这些数据构成了 10 个功能观测值 Heighti(t)的样本。
从这些数据中,我们可以发现一些细微特征。通过 Ramsay 等人(1995a)的技术估计出的加速度曲线 D2Heighti 显示,青春期生长突增表现为强烈的正加速度脉冲,随后是急剧的负减速。此外,大多数记录在 6 岁左右还出现了一个被称为中期突增的凸起。这表明曲线之间的某些变化可以在导数层面得到解释,也进一步说明应将这些记录视为函数而非离散时间的观测向量。
由于年龄并非等间距分布,这会影响一些常规分析。例如,简单地对 9、10 和 10.5 岁的身高进行相关性分析,无法考虑到间隔半年的两个年龄点之间的相关性应高于间隔一年的情况。而且,一般来说,函数的观测点在不同记录中可能会有所不同。
1.1.2 美国制造业数据
并非所有功能数据都涉及独立重复观测,我们常常需要处理单个长记录。美国非耐用消费品制造业指数就是这样一个重要的经济指标。这类数据通常呈现出多层次的变化。
该指数在整个世纪中呈现出几何或指数增长的趋势,对数
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



