数据清洗级可视化中,Pandas&numyp的主要作用

Pandas:
Pandas提供了强大的数据结构和数据分析工具,特别是其DataFrame数据结构,非常适合用于数据清洗和整理
例如,可以使用Pandas的dropna()函数删除包含缺失值的行或列,这是数据清洗的重要步骤。此外,Pandas还支持数据类型转换、异常值处理等数据清洗任务,以及时间序列图、柱状图和折线图等基本数据可视化方法

NumPy
专注于数值计算,提供了高效的数组操作功能,适用于大规模数值数据的清洗和预处理

两者的主要区别在于:
Pandas更侧重于数据分析和处理,提供了丰富的数据操作和分析功能,而NumPy更侧重于数值计算,提供了高效的数组操作功能。
Pandas的DataFrame是基于NumPy数组构建的,这意味着Pandas在处理表格数据时,底层仍然是使用NumPy数组进行存储和计算。
Pandas提供了更多的数据可视化功能,而NumPy主要关注数值计算,不直接提供数据可视化功能。

  • openpyxl

openpyxl 是一个 Python 库,专门用于读取和写入 Excel 文件(.xlsx 格式)。它提供了强大的功能,可以让你在 Python 程序中轻松操作 Excel 表格,比如创建新的 Excel 文件、读取现有文件的内容、修改单元格数据、添加公式等。
它是处理 Excel 文件的常用工具之一,尤其适合处理复杂的 Excel 数据操作

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值