前期在数据探索性分析时,通常需要根据数据的总体概况来了解数据特征,pandas_profiling这个库可以一键生成数据分析报告,可以快速查看所有数据的分布以及各参数之间的相关性信息,给后期分析带来了极大的便利。
一、profile_report使用
一行语句即可data.profile_report():
解释变量:
Overview:数据概况
Variables:各变量分布情况
Interactions:变量间相关性
Correlations:相关性热力图
Missing values:缺失值
Sample:数据集部分示例
pip install pandas_profiling
df=pd.read_excel('data.xlsx')
df.profile_report(title='savings')
原始数据

Overview

Variables

Interactions

Correlations

Missing values

二、导出html文件
data=df.profile_report(title='savings')
data.to_file(output_file='savings')
pandas_profiling库提供了一键生成数据分析报告的功能,通过data.profile_report()可以快速查看数据概况、变量分布、相关性、缺失值等关键信息,简化了前期的数据准备工作。此外,报告还可导出为html文件,便于分享和存档。
1430

被折叠的 条评论
为什么被折叠?



