目录
前言
时至如今Pandas仍然是十分火热的基于Python的数据分析工具,与numpy、matplotlib称为数据分析三大巨头,是学习Python数据分析的必经之路。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法,它是使Python成为强大而高效的数据分析环境的重要因素之一。
使用Pandas进行数据预处理时需要对Pandas的基础数据结构Series和DataFrame有一个基础的了解。若是还不清楚的可以再去看看我之前的详解博文:
结合Pandas处理不同种类的数据,算下来共有重复值处理、缺失值处理、异常值处理等众多处理数据的方法。但我们使用Pandas做数据分析进阶操作,经常会使用到机器学习算法模型以及神经网络等算法,需要我们对数据进行预处理操作,其中就有label标签数据。而Pandas将此类标签数据单独提取出作为Catagorical data分类数据。了解处理此类型数据能够高效提升对我们进行数据进行建模和分析。对数据分析处理感兴趣的还可以阅读博主前几篇详解博文: