numpy
NumPy(Numerical Python)是Python语言的一个扩展程序库。支持高阶大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
pandas
pandas(panel data)是Python的核心数据分析支持库,它是基于numpy的,用于数据分析和数据处理。
scipy
scipy是一个用于数学、科学、工程领域的常用软件包,可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。
sklearn
sklearn (scikit-learn) 是基于 Python 语言的机器学习工具,建立在numpy, scipy, matplotlib上。
matplotlib
Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。
%matplotlib inline #表示将图表嵌入到Notebook中
seaborn
Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。
Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式。
plotly
plotly是一个用于做分析和可视化的在线工具,plotly与pandas可以无缝地集成,可以做出很多非常丰富,互动的图表,并且文档非常健全,创建条形图相对简单,另外申请了API密钥后,可以一键将统计图形同步到云端。
本文介绍了Python在数据科学领域的核心库,包括NumPy、pandas、SciPy、scikit-learn和Matplotlib等,涵盖了从数组运算、数据分析、科学计算到机器学习和数据可视化的各个方面。

被折叠的 条评论
为什么被折叠?



