第2章 统计建模
本章讨论统计建模。统计建模是量化金融的驱动力,因此这是在R中学习量化金融的第一步。我们假定读者熟悉R语言基础编程知识并对相关的统计概念有一定了解。在本章中,我们不会详细讨论统计概念,而是展示如何用R进行统计建模。
本章包括以下内容。
- 概率分布
- 抽样
- 统计量
- 相关性
- 假设检验
- 参数估计
- 异常值侦测
- 标准化
- 归一化
2.1 概率分布
概率分布(probability distributions)确定随机变量的取值是如何分布的。比如,抛硬币得到所有可能结果的集合是二项式分布。基于总体数据的大样本均值遵循正态分布,而正态分布是最常见和有用的分布。
统计学对这些概率分布的性质有很好的理解,可用来进行关于总体的推断。在本节中,我们会讨论几种最常见的概率分布并说明用来计算概率分布相关性质的R函数。
2.1.1 正态分布
正态分布(normal distribution)是金融行业最广泛使用的概率分布。正态分布为钟型曲线,它的均值、中位数和众数都相同。正态分布表示为