数理统计是以概率论为基础的应用数学的一个重要分支,是专门研究关于数据的收集、整理、描述和推断的一个数学学科。由于这种具有普遍的意义,它几乎渗透到一切自然科学、技术科学、生物科学等领域,并分别形成了工业统计、医学统计、生物统计、体育统计等学科。
体育统计是运用数理统计的理论和方法对体育领域里各种随机现象的规律性进行研究的一门基础性应用学科,属于方法论学科范畴。体育运动中出现的现象或者事件大都是随机的,这种现象正是数理统计要研究的对象,从而形成了体育统计这么学科。目前,体育统计已经被广泛地应用于体育的各个领域,如生理生化、体育测量评价等学科的研究工作都大量的采用了统计学方法。最初,运动生物力学的个案研究较多,近些年来,随着测试仪器的不断发展以及应用上的愈加方便,测试的样本含量相对增加了,在运动生物力学界统计学方法也得到了额较为普遍的应用。例如:评价训练水平、运动技术、身体生长发育水平;分析教学方法、运动强度、密度对掌握技术与增强体制的关系;比较不同的训练方法、教学方法的效果;教学训练过程的控制;教学训练效果的预测等等。
体育统计的主要内容大体可以分为描述统计、推断统计和试验或调查研究:(1)试验或调查研究设计。目前,在体育科研领域,非常容易忽视试验设计,显著性水平不能预先确定占一次调查总数的96%,另外样本含量的随意确定、统计方法选择不当等现象比较严重。(2)描述统计。主要将试验或者调查所获得的大量数据经过归纳、压缩、简化和整理后,从中找出这些数据的分布特征,制成图表,或借助这些数据的分布特征,如集中趋势、离中趋势、相关程度等,计算出一些具有概括性的统计数字,如平均值、标准差、相关系数等。借助这些概括性的数字,即可从庞杂无章的数据中获得具有实用意义的信息,以便对不同总体进行分析比较,作出合乎规律的结论。(3)推断统计。在正确的描述统计的基础上,应用数据所传递的信息,通过样本的数据来推断总体的性质,并标明这种推断可能发生的误差范围。
在体育统计中,有很多问题不仅仅包括单一的影响因素,往往是多个因素共同作用的结果。例如,人体制的强弱与身体形态发育水平、生理机能水平、身体素质以及运动能力水平、心理的发育水平以及适应能力等诸多方面的因素都有关系。对于这样一个复杂的问题进行统计学分析,一种方法是可以固定其它因素而只研究上述众多因素当中的一个因素,其结果是很难从整体上对问题进行全面的描述和推断,无法揭示出各影响因素的内在联系以及所有影响因素对体制的综合影响;另外一种方法可以对多个影响因素进行综合评价、系统的统计学分析,我们称之为体育多元分析,是指研究体育领域中多个变量(指标或者因素)之间关系的一类统计方法的总称。这类方法的主要目标是从反映事务相互关联的多个因素中,找寻支配事务的主要因素,对事务进行科学的预测或判断,从而能够综合地对事务的整体进行描述或判断。
多元分析方法种类繁多,不同学者从不同角度出发对其进行分类,例如美国学者库利和柯尼斯按照变量的组数和群体数分为下述四类:(1)因子分析(2)复相关、偏相关和典型相关(3)多因素方差分析(4)判别分析和聚类分析。英国统计学家则根据研究的目的将多元分析方法分为两大类:相依性分析和互相依性分析。多元相关分析(复相关、偏相关、典型相关)、多元方差分析、多元因果分析(多元线性回归、逐步回归、路径分析、对数线性分析)、判别分析均属于相依性分析,它们的共同特点是分析所涉及的变量是不平等的,即有自变量和因变量之分。相依分析的目的在于分析多个变量对某个或某些变量的共同影响和相对效应。互相依性分析所涉及的变量是平等的,分析的目的是变量之间的相互关系,以简化这种相互关系。聚类分析、因子分析均属于互相依性分析。
应当指出的是,每一种多元分析方法都是建立在一系列假设前提的基础上,这些假设即包括这一方法所涉及的变量的测量层次,也包括这些变量间相互关系的性质,以及资料的不同来源。例如线性回归分析要求所涉及的变量均为定距变量,自变量间的关系是相互独立、线性可加的。因此,在选择一种分析方法时,应首先考察这一方法所要求的前提条件是否得到满足,若某些条件没有得到满足,就要想办法进行某种统计处理,例如对于定类变量,可先将其变为虚拟变量后再引入回归模型。