开发者的自然语言处理与机器学习:NumPy 与线性回归入门
1. 数据样本生成与统计信息计算
首先,我们可以使用 NumPy 生成一个数据样本,并计算其统计信息,如四分位数、最小值和最大值。以下是示例代码:
import numpy as np
from numpy import percentile
# generate data sample
data = np.random.rand(1000)
# calculate quartiles, min, and max
quartiles = percentile(data, [25, 50, 75])
data_min, data_max = data.min(), data.max()
# print summary information
print('Minimum: %.3f' % data_min)
print('Q1 value: %.3f' % quartiles[0])
print('Median: %.3f' % quartiles[1])
print('Mean Val: %.3f' % data.mean())
print('Std Dev: %.3f' % data.std())
print('Q3 value: %.3f' % quartiles[2])
print('Maximum: %.3f' % data_max)
上述代码中, np.random.rand(1000) 生成了一个包含 1000 个 0 到 1 之间均匀分布的随机数的数组。 percentil
超级会员免费看
订阅专栏 解锁全文
2175

被折叠的 条评论
为什么被折叠?



