一、数据的分类
二、统计分析流程

三、数据分析的误区
1.展示元素不宜大于3个
2.时间序列数据最好使用折线图,而不宜使用柱状图
3.研究数据最好不适用三维立体图
4.为避免图表的欺骗性,图线最好占据2/3至3/4的高度(调整Y轴刻度)
四、常用的统计抽样方法主要有三种:
4.1随机抽样法
总体中每个个体都有同等可能被抽到,常用抽签或随机表来保证样品的代表性-----当个体的种类不多时,样本总数较少,且抽取的样本数较少,随机抽样是一种有效的抽样方法
4.2分层抽样法
先将总体按照研究内容密切相关的主要因素分类或分层,然后在各层中按照随机原则抽取样本。优点:分层抽样可以减少层内差异,增加样本的代表性。---当个体种类较多时,样本种类差别明显,分层抽样是一种有效的抽样方法。
4.3系统抽样法
从总体中每隔K个个体抽取一个,k =总体容量N/样本容量n,系统抽样适用于样本总数很多,差异不明显,抽取的样本数也比较多,且容易作某种次序的整理时,系统抽样比分层抽样好。
五、数据分布
抽样的目的是反映总体,将测试的样本数据进行整理加工,找出特性,从而推断总体的变化规律、趋势和性质。用样本参数近似描述总体状况。
数据分布可以用中心倾向和数据的分散程度来表示:
5.1中心倾向
平均值:
中位值:
5.2数据分散程度
样本方差和样本标准差就是用来度量数据波动幅度大小的一个重要特性值
方差:样本方差是一组数据中每一个数值与平均值之差的平方和的平均值,通常记为
标准(偏)差:样本方差的平方根S称作样本标准偏差
极差:
六、数据分析方法
6.1层别法
层别法是所有手法中最基本