全文共2286字,预计学习时长9分钟
图源:dayliscrawl
作为数据分析对外输出的关键环节,可视化技术可是数据科学家的必备技能之一。各种各样的图标花样繁多,可别被这些炫酷的“造型”吓退了。
本文将介绍九种不同的可视化技术,可以用来分析任何数据集,并且大多数都只需要少输入一行代码。就两个字,好用!
加载数据集和快速浏览数据
为简单起见,使用可从scikit-learn库加载的Iris数据集,输入以下代码:
from sklearn.datasets importload_iris
import pandas as pddata = load_iris()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['species'] = data['target']
df.head()
可以看到,我们有一个只有5列的数据集。使用数据框上的info()函数对其进行快速分析: df.info()
如图可见,只有150个条目,在任