作者:禅与计算机程序设计艺术
1.简介
概述
随着科技的飞速发展、生产制造的极其复杂化、经济的不断进步、信息技术的日新月异、生活的不断便利等等原因,人类的社会发展速度也在不断加快。其中最突出的变化就是物质生活的数字化程度越来越高。数字化的产生已经改变了传统物理世界观念和原有的生产方式。 从个人生活到商业交易,数字化已经渗透到每一个方面,各种各样的数据都已经成为生产活动的重要组成部分。数据分析对于理解市场、客户、产品和服务的作用至关重要。因此,数据分析人员需要对数据的概括、统计、可视化、建模等过程有所了解。 本文将介绍一种重要的概率分布——多元高斯分布(Multivariate Gaussian Distribution)和正态分布(Normal Distribution),并通过比较和应用它们来解决实际问题。同时,本文将涉及一些相关的概念及术语。
历史沿革
正态分布的由来
19世纪末,卡尔·雅克·詹姆斯( )提出了“统计学基础”的概念,成为社会科学的奠基性工作。他认为统计学是研究如何收集、整理、处理和分析数据。随后,科学和工程界为了描述、预测和控制自然现象,纷纷提出统计方法。其中包括最大似然估计(MLE)、最小二乘法(OLS)、马氏矩阵、残差平方和绝对值等方法。这些方法虽然取得