数据挖掘之统计学基础(4):【实践】数据分布-Python实战

import numpy as np
import pandas as pd
import time

import matplotlib as mpl
import matplotlib.pyplot as plt

%matplotlib inline

plt.style.use('ggplot')
plt.rcParams['figure.figsize'] = (18.0, 10.0)

pd.set_option('display.float_format', lambda x: '%.4f' % x)
pd.set_option('display.max_rows', 200)
pd.set_option('display.max_columns', 200)

1. 使用 Python 验证数据集中的体温是否符合正态分布。

- 数据集地址:http://jse.amstat.org/datasets/normtemp.dat.txt
- 数据集描述:总共只有三列:体温、性别、心率
- 数据集详细描述:Journal of Statistics Education, V4N2:Shoemaker

加载数据

# filename = 'http://jse.amstat.org/datasets/normtemp.dat.txt'
filename = 'normtemp.dat.txt'

feature_name_list = [
    '体温'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值