在只给出了n个样本数据的情况下,推测总体均值的区间估计
应用场景:给出n个家庭信用卡债务的数据,来估计美国家庭信用卡债务的总体均值
原理说明:对于任何数据集,设:均值为 x_mean, 则所有的 x_i - x_mean的平方和都等于 0, 因此(x_i - x_mean)中只有 n - 1 项是独立的,即:如果我们知道了n - 1个值,则由所有(x_i - x_mean)的值之和为 0,可以确定余下的值。
import numpy as np
from scipy import stats
global base_data
def SetBaseData():
global base_data
base_data = np.random.randint(low=6500, high=20000, size=600) # 给出600个家庭信用卡借款数据
return
def PrisionWork():
# 置信度为:a = 0.95 自由度为 ts = n - 1,这里 n = 600,因此自由度为 509
a = 0.95
n = 600
ts = n - 1
# 进行抽样,求去样本的t分布下,均值x_mean,标准差 x_s
mean_list = list([])