《概率论与数理统计》作业一,python画频率分布表

5.1

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WSLzZT8S-1601898549192)(C:\Users\10539\Desktop\课程\数理统计\作业\1\5.1.PNG)]

2:

总体:全体成年男子的抽烟情况
样本:50个同学调查到的全部5000名男子
总体分布:Bernoulli分布

5:

总体:某场生产的所有电容器
样本:抽出的n件产品
样本分布:
假设每个样本的分布iid,且都服从指数分布
P ( X 1 = x 1 , X 2 = x 2 , . . . , X n = x n ) = Π i = 1 n λ e − λ x i P(X_1=x_1,X_2=x_2,...,X_n=x_n)=\Pi_{i=1}^{n} \lambda e^{-\lambda x_i } P(X1=x1,X2=x2,...,Xn=xn)=Πi=1nλeλxi

6:

我认为这个结论是不合理的,因为总体是所有毕业生,但是样本是返校毕业生,工资低混的不好的毕业生不太愿意返校,抽样不随机。毕业生平均工资低于5万美金。

平均工资,平均年龄等样本数据一般有偏,样本均值不适合代表平均水平。

5.2

在这里插入图片描述
在这里插入图片描述

2:

3+4+8+3+2=20

分布函数要求右连续
F 20 ( x ) = { 0 x < 38 3 20 38 ≤ x < 48 7 20 48 ≤ x < 58 3 4 58 ≤ x < 68 9 10 68 ≤ x < 78 1 x ≥ 78 F_{20}(x)=\left\{ \begin{aligned} &0 \qquad & x< 38 \\ &\frac{3}{20} & 38\leq x< 48 \\ &\frac{7}{20} & 48\leq x< 58\\ &\frac{3}{4} &58\leq x<68\\ &\frac{9}{10}&68\leq x< 78\\ &1& x\geq 78 \end{aligned} \right. F20(x)=0203207431091x<3838x<4848x<5858x<6868x<78x78

3:

#顺序排列
import numpy as np
import pandas as pd
t2=[909,1086,1120,999,1320,1091,1071,1081,
    1130,1336,967,1572,825,914,992,1232,950,
    775,1203,1025,1096,808,1224,1044,871,1164,971,950,866,738]
t2=np.sort(t2)#排序
print(t2.shape,t2,(np.max(t2)-np.min(t2))/6)
(30,) [ 738  775  808  825  866  871  909  914  950  950  967  971  992  999
 1025 1044 1071 1081 1086 1091 1096 1120 1130 1164 1203 1224 1232 1320
 1336 1572] 139.0
#频率分布表
#取间隔为140
t22=pd.cut(t2,6, labels=[u"(737,877]",u"(877,1017]",u"(1017,1157]",u"(1157,1297]",u"(1297,1437]",u"(1437,1577]"])
t22=t22.value_counts()
t22=pd.DataFrame(t22)
t22['分组区间'] = t22.index
t22.columns = ['频数','分组区间']
t22.reset_index(drop=True, inplace=True)  
t22['组中值'] =[807,947,1087,1227,1367,1507]
t22['频率']=t22['频数']/30
##计算累计频率
ljpl=[0]
for i in t22['频率']:
    ljpl.append(i+ljpl[-1])
t22['累计频率']=ljpl[1:]
t22=t22[['分组区间','组中值','频数','频率','累计频率']]
t22
分组区间 组中值 频数 频率 累计频率
0 (737,877] 807 6 0.200000 0.200000
1 (877,1017] 947 8 0.266667 0.466667
2 (1017,1157] 1087 9 0.300000 0.766667
3 (1157,1297] 1227 4 0.133333 0.900000
4 (1297,1437] 1367 2 0.066667 0.966667
5 (1437,1577] 1507 1 0.033333 1.000000
#画直方图
import matplotlib.pyplot as plt  
plt.rcParams['font.family'] = 'sans-serif'
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False

plt.hist(t2, bins=6)
plt.title('第三题直方图')
Text(0.5, 1.0, '第三题直方图')

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5ylinAyk-1601898549195)(output_3_1.png)]

5:

t5=[5954,5022,14667,6582,6870,1840,2662,4508,
   1208,3852,618,3008,1268,1978,7963,2048,
   3077,993,353,14263,1714,11127,6926,2047,
   714,5923,6006,14267,1697,13867,4001,2280,
   1223,12579,13588,7315,4538,13304,1615,8612]
t5=np.sort(t5)
print(t5.shape,t5)
(40,) [  353   618   714   993  1208  1223  1268  1615  1697  1714  1840  1978
  2047  2048  2280  2662  3008  3077  3852  4001  4508  4538  5022  5923
  5954  6006  6582  6870  6926  7315  7963  8612 11127 12579 13304 13588
 13867 14263 14267 14667]
(14667-353)/1700
8.42
ran=[]
for i in range(10):ran.append(352+i*1700)

lable=[]
for i in range(9):
    lable.append('('+str(ran[i])+','+str(ran[i+1])+']')
lable
['(352,2052]',
 '(2052,3752]',
 '(3752,5452]',
 '(5452,7152]',
 '(7152,8852]',
 '(8852,10552]',
 '(10552,12252]',
 '(12252,13952]',
 '(13952,15652]']
t55=pd.cut(t5,ran, labels=lable)
t55=t55.value_counts()
t55=pd.DataFrame(t55)
t55['分组区间'] = t55.index
t55.columns = ['频数','分组区间']
t55.reset_index(drop=True, inplace=True)  
#组中值
zzz=[]
for i in range(9):
    zzz.append(ran[i]+1700/2)
t55['组中值'] =zzz
t55['频率']=t55['频数']/40
##计算累计频率
ljpl=[0]
for i in t55['频率']:
    ljpl.append(i+ljpl[-1])
t55['累计频率']=ljpl[1:]
t55=t55[['分组区间','组中值','频数','频率','累计频率']]
t55
分组区间 组中值 频数 频率 累计频率
0 (352,2052] 1202.0 14 0.350 0.350
1 (2052,3752] 2902.0 4 0.100 0.450
2 (3752,5452] 4602.0 5 0.125 0.575
3 (5452,7152] 6302.0 6 0.150 0.725
4 (7152,8852] 8002.0 3 0.075 0.800
5 (8852,10552] 9702.0 0 0.000 0.800
6 (10552,12252] 11402.0 1 0.025 0.825
7 (12252,13952] 13102.0 4 0.100 0.925
8 (13952,15652] 14802.0 3 0.075 1.000
plt.hist(t5, bins=ran)
plt.title('第五题直方图')
Text(0.5, 1.0, '第五题直方图')

在这里插入图片描述

5.3

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3:

y ˉ = 3 x ˉ − 4 \bar{y}=3\bar{x}-4 yˉ=3xˉ4

s y 2 = 1 n − 1 ∑ i ( y i − y ˉ ) 2 = 1 n − 1 ∑ i ( 3 x i − 4 − ( 3 x ˉ − 4 ) ) 2 = 1 n − 1 ∑ i 9 ( x i − x ˉ ) 2 = 9 s x 2 s_y^2=\frac{1}{n-1}\sum_{i}(y_i-\bar{y})^2=\frac{1}{n-1}\sum_{i}(3x_i-4-(3\bar{x}-4))^2=\frac{1}{n-1}\sum_{i}9(x_i-\bar{x})^2=9s_x^2 sy2=n11i(yiyˉ)2=n11i(3xi4(3xˉ4))2=n11i9(xixˉ)2=9sx2

4:

pf:
( n + 1 ) x n + 1 ˉ − ( n + 1 ) x n ˉ = x n + 1 − x n ˉ (n+1)\bar{x_{n+1}}-(n+1)\bar{x_n}=x_{n+1}-\bar{x_n} (n+1)xn+1ˉ(n+1)xnˉ=xn+1xnˉ
左右同时除以n+1即得所证

pf:
$ns_{n+1}2-(n-1)s_{n}2=\sum_{i=1}{n+1}(x_i-\bar{x}_{n+1})2-\sum_{i=1}{n}(x_i-\bar{x}_n)2
=x_{n+1}2-2(\sum_{i=1}{n+1}x_i \bar{x}{n+1}-\sum{i=1}^{n}x_i \bar{x}{n})+((n+1)\bar{x}{n+1}2-n\bar{x}_n2)=x_{n+1}2-2[x_{n+1}\bar{x}_{n+1}-\sum_{i=1}{n}x_i(\bar{x}{n+1}-\bar{x}{n})]+((n+1)\bar{x}{n+1}2-n\bar{x}_n2)=x{n+1}2-2[x_{n+1}\bar{x}_{n+1}-\frac{n}{n+1}(x_{n+1}-\bar{x}_n)\bar{x}_n]+((n+1)\bar{x}_{n+1}2-n\bar{x}_n^2)
$
x ˉ n + 1 \bar{x}_{n+1} xˉn+1带入上一条证明中的 x ˉ n + 1 n + 1 ( x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值