数据分析报告-pandas_profiling库

pandas_profiling库提供了一键生成数据分析报告的功能,通过data.profile_report()可以快速查看数据概况、变量分布、相关性、缺失值等关键信息,简化了前期的数据准备工作。此外,报告还可导出为html文件,便于分享和存档。

前期在数据探索性分析时,通常需要根据数据的总体概况来了解数据特征,pandas_profiling这个库可以一键生成数据分析报告,可以快速查看所有数据的分布以及各参数之间的相关性信息,给后期分析带来了极大的便利。

一、profile_report使用

一行语句即可data.profile_report():
解释变量:
Overview:数据概况
Variables:各变量分布情况
Interactions:变量间相关性
Correlations:相关性热力图
Missing values:缺失值
Sample:数据集部分示例

pip install pandas_profiling
df=pd.read_excel('data.xlsx')
df.profile_report(title='savings')

原始数据
在这里插入图片描述

Overview
在这里插入图片描述

Variables
在这里插入图片描述

Interactions
在这里插入图片描述
Correlations
在这里插入图片描述

Missing values
在这里插入图片描述

二、导出html文件

data=df.profile_report(title='savings')
data.to_file(output_file='savings')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值