参考链接:
https://my.oschina.net/u/4581316/blog/4898542 https://blog.youkuaiyun.com/weixin_26746401/article/details/108260112
数据分析的EDA是一个必不可少的过程,一个能够自动生成数据基础分析报告的工具,可以节省大量的人工。
EDA的主要实现功能有:单变量的分析、多变量的联合分析、因变量与自变量的联合分析
在此,主要介绍两个工具:Pandas-Profiling,Sweetviz。
两个工具的功能类似,都能生成HTML的分析报告,不同的是Sweetviz需要Python3.6及以上的版本,并且可以比较两个数据集间差异
安装命令: pip install pandas-profiling, pip install sweetviz
使用:
1. pandas-profiling
github链接: https://github.com/pandas-profiling/pandas-profiling
-
报告内容:
-
总概
-