python 数据分析---实现代码

这篇博客介绍了如何使用Python进行数据分析,包括计算数据集的均值、方差、协方差和相关系数,并展示了绘制柱状图、直方图、饼图和箱式图的代码。更多分析代码将在后续更新中补充。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

代码实现了分析数据集所需的基本量值:均值方差协方差相关系数,也给出了绘制各类图标的代码:柱状直方饼状箱式散点。

# -*- coding: utf-8 -*-
"""
Created on Fri Nov  9 10:25:46 2018

@author: user
"""

import numpy as np

"""
 生成虚拟数据
"""
n=5  # 特征数目
m=6  # 样本数目
data=np.random.rand(n,m)*10

"""
 基本描述性统计量
"""
d_mean=np.mean(data,0)  # mean(data):全部的均值,mean(data,0):按行做均值, mean(data,1):按列做均值
d_median=np.median(data)  # 中位数,解释和使用同上
d_ptp=np.ptp(data,0)  # 极差,解释和使用同上
d_var=np.var(data,0)  # 方差,同上
d_std=np.std(data,0)  # 标准差,同上
d_CV=d_std/d_mean  # 变异系数,即无量纲化,表示数据群的稳定程度. 此处除法是对应元素相除
for i in range(n):
    d_Zscore=(data[i,:]-np.mean(data,1))/np.std(data,1)  # 每个样本第 i 个特征取值的偏差程度


"""
衡量相关程度
"""
d_cov=np.cov(data[:,0],data[:,1])  # 前两列数据的协方差矩阵 (0,0):第一列方差,(0.1)(1,0):两列数据协方差,(1,1)第二列方差
d_cor=np.corrcoef(data[:,0],data[:,1])  # 前两列数据的相关系数  各个元素解释同上

"""
图表分析
"""
"""
图表分析(一):单数据描述
"""
import matplotlib
data=np.vectorize(int)(data)  # 修改一下数据,方便使用图标表示
def drawBar(data):  # 柱状图
    n,m=np.shape(data)
    d
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值