一些重要的概念:
-
median,中值
mean,均值
- continues data(variable data)
discrete data(categorical data, attribute data)
nomial
ordinal
- location
spread
- variance,方差 =((x1-中值)*(x1-中值)+(x2-中值)*(x2-中值)+...+(xn-中值)*(xn-中值))/(n-1)
- standard deviation,标准偏差 = 方差开二次方
- range,收集的所有数据中,最大值-最小值
过程能力 Cp和Cpk
- Cpk永远都不会大于Cp,最多相等
- 如果一个流程满足6sigma,则其Cp>2, Cpk>1.5
- Cp = |USL-LSL|/6Sigma。Cp的值越大越好,6Sigma的目标为Cp=2。如果Cp>=1就达到了3Sigma的水平。
- USL和LSL是来自于客户的需求(声音)。供应商的目标,就是减少Sigma的值,使Cp的值大于2
- USL和LSL一般对称于客户期望的中值?当然,实际产品的中值可能并不对称于USL和LSL。这种产品实际中值和客户期望中值的偏差,有Cpk来表达
- 当达到6Sigma标准时,则|USL-LSL|〉=12Sigma。则USL和LSL与中值的距离,大于等于6Sigma,即达到6Sigma标准
置信区间
典型的置信区间是95%
比较等式(comparison statement)
1) comparison types
One-to-Standard
One-to-One
Multiple Comparisons
2) comparison directory
one side
two side
3) parameter
mean
median
proportion
standard deviation
4)hypotheses
Null Hypothesis:假设没有不同,H0
Alternative Hypothesis:假设有不同,H1或Ha
基本方法:
典型的置信区间是95%
比较等式(comparison statement)
1) comparison types
One-to-Standard
One-to-One
Multiple Comparisons
2) comparison directory
one side
two side
3) parameter
mean
median
proportion
standard deviation
4)hypotheses
Null Hypothesis:假设没有不同,H0
Alternative Hypothesis:假设有不同,H1或Ha
- 对于one-side比较,Null Hypothesis的形式是“>=”对应的Alternative Hypothesis是“<”;或者Null Hypothesis的形式是“<=”对应的Alternative Hypothesis是“>”
- 对于two-side比较,Null Hypothesis的形式是"=",对应的Alternative Hypothesis是“不等于”
基本方法:
- 流程问题描述
- 列出比较语句(假设格式)
- 分析
- 统计学结论
- 从流程角度给出结论
比较连续数据时,主要比较数据的均值(mean),而且数据需要满足一定的统计假设:
- 数据是独立的
- 数据时正态分布的
- 多次采样的数据有相同的方差
- 以上的每一个假设,都需要做检验(hypotheses)