牛客题解 | 描述性统计计算器

题目

题目链接

描述性统计是一种描述数据集特征的方法,通过若干类数据统计值来进行统计。本题具体使用的统计值如下

  1. 平均值(mean)
    μ = 1 n ∑ i = 1 n x i \mu = \frac{1}{n}\sum_{i=1}^{n} x_i μ=n1i=1nxi

  2. 中位数(median)
    将数据从小到大排序后:
    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  3. 众数(mode)
    出现次数最多的数值:
    m o d e = arg ⁡ max ⁡ x f ( x ) mode = \arg\max_x f(x) mode=argxmaxf(x)
    其中 f ( x ) f(x) f(x) x x x 出现的频率

  4. 方差(variance)
    σ 2 = 1 n − 1 ∑ i = 1 n ( x i − μ ) 2 \sigma^2 = \frac{1}{n-1}\sum_{i=1}^{n} (x_i - \mu)^2 σ2=n11i=1n(xiμ)2

  5. 标准差(standard_deviation)
    σ = 1 n − 1 ∑ i = 1 n ( x i − μ ) 2 \sigma = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n} (x_i - \mu)^2} σ=n11i=1n(xiμ)2

  6. 25th百分位数(25th_percentile)
    Q 1 = P 25 Q_1 = P_{25} Q1=P25
    25%百分位数是数据从小到大排序后,第25%个数据,剩下的百分位数同理。

  7. 50th百分位数(50th_percentile)
    Q 2 = P 50 = m e d i a n Q_2 = P_{50} = median Q2=P50=median

  8. 75th百分位数(75th_percentile)
    Q 3 = P 75 Q_3 = P_{75} Q3=P75

  9. 四分位距(interquartile_range)
    I Q R = Q 3 − Q 1 IQR = Q_3 - Q_1 IQR=Q3Q1
    四分位距是数据集中位于25%到75%之间的数据范围。

标准代码如下

def descriptive_statistics(data):
    data = np.array(data)
    mean = np.mean(data)
    median = np.median(data)
    unique, counts = np.unique(data, return_counts=True)
    mode = unique[np.argmax(counts)] if len(data) > 0 else None
    variance = np.var(data)
    std_dev = np.sqrt(variance)
    percentiles = np.percentile(data, [25, 50, 75])
    iqr = percentiles[2] - percentiles[0]
    stats_dict = {
        "mean": mean,
        "median": median,
        "mode": mode,
        "variance": np.round(variance,4),
        "standard_deviation": np.round(std_dev,4),
        "25th_percentile": percentiles[0],
        "50th_percentile": percentiles[1],
        "75th_percentile": percentiles[2],
        "interquartile_range": iqr
    }
    return stats_dict

在scipy库和pandas库中也有对应的描述性统计计算方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值