机器学习_07_数据特征、分布情况

本文详细介绍了使用Pandas库进行数据操作的方法,包括查看数据前10行、数据维度、数据类型、统计数据描述、数据分类分布、属性相关性矩阵及正态分布偏离程度等关键操作。

001查看前10行数据

from pandas import read_csv
#  03.采用pandas 导入数据
filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.shape)
#001查看前10行数据
peek = data.head(10)
print(peek)

002.sahpe 属性查看数据维度:多少行多少列

from pandas import read_csv
#  002.sahpe 属性查看数据维度:多少行多少列
filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.shape)

在这里插入图片描述
003.type 属性查看数据类型:int,float

from pandas import read_csv
#  003.type 属性查看数据类型:int,float

filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.dtypes)

在这里插入图片描述
004.describe() 方法查看统计内容的描述: max,min,etc.

from pandas import read_csv
#  004.describe() 方法查看统计内容的描述: max,min,etc

filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin',
	'test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.describe())

在这里插入图片描述
005.查看数据分类分布状况 groupby().class()

from pandas import read_csv
#  005.查看数据分类分布状况 groupby().class()

filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.groupby('class').size())

在这里插入图片描述
006.corr()方法——计算属性相互影响的矩阵

from pandas import read_csv
from pandas import set_option
#  006.corr()方法——计算属性相互影响的矩阵
#   显示数据相关性
filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
set_option("display.width",100)
#设置数据的精度
set_option("precision",2)
print(data.corr(method='pearson'))

在这里插入图片描述
007.计算数据的正态分布偏离程度

from pandas import read_csv
#  007.计算数据的正态分布偏离程度

filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.skew())

在这里插入图片描述

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值