NumPy:主要提供基础的数组数据结构和距阵运算
(1)快速高效的多维数组现象
(2)可执行向量化计算
(3)提供线性代数等距阵
(4)可集成c代码
SciPy:基于NumPy提供了大量的科学计算算法(信号处理、最优化求解等等),解决标准问题。
(1)数值积分和微分方程求解
(2)扩展的矩阵计算功能
(3)最优化工具
(4)概率分布计算和统计函数
(5)信号处理函数
Pandas:提供data frame 数据结构,便于处理真实数据集。
(1)易用、高效的数据操作函数库
(2)执行join以及其他SQL类似的功能来重塑数据
(3)提供包括dataframe在内的数据结构
(4)提供各种格式(包括数据库)输入输出
(5)支持时间序列
Matplotlib:擅长数据绘图,绘制交互式可视化图像。
(1)提供一套与matlab相似的命令API
(2)十分适合交互式绘图
(3)可以作为绘图控件嵌入GUI
Seaborn:统计绘图
StatsModels:统计模型
scikit-learn:机器学习
(1)建立在NumPy,SciPy基础上
(2)通过统一接口来使用,可以迅速在数据集上实现流行的算法
(3)包含许多用于标准机器学习任务的工具
Requests:网页数据抓取
Beautiful Soup:解析网页数据
Flask:轻量级的web框架
sqlite3:轻量级数据库接口
Pyspark:Spark的Python接口
nltk:自然语言处理
networkx:社交网络分析
theano:深度学习
python 的工具包的应用
最新推荐文章于 2025-07-06 13:07:43 发布