pandas介绍
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
它是使Python成为强大而高效的数据分析环境的重要因素之一。
推荐6个Python数据分析神器!!
用Python处理数据大家都不陌生了,属常规操作,但常规之下还是也有些暗藏技巧的,本篇东哥分享6个好玩高效的操作,帮助大家提高效率。
一、Pandas Profiling
Pandas Profiling提供数据的一个整体报告,是一个帮助我们理解数据的过程。它可以简单快速地对Pandas的数据框数据进行探索性数据分析。
其实,Pandas中df.describe()和df.info()函数也可以实现数据探索过程第一步。但它们只提供了对数据非常基本的概述。而Pandas中的Profiling功能简单通过一行代码就能显示大量信息,同时还能生成交互式HTML报告。
二、pretty print
pprint是Python中的内置模块。它能够以格式清晰,可读性强漂亮格式打印任意数据结构。一个例子对比下print和pprint。
定义个字典,测试用
my_dict = {‘Student_ID’: 34,‘Student_name’ : ‘Tom’, ‘Student_class’ : 5,
‘Student_marks’ : {‘maths’ : 92,
‘science’ : 95,
‘social_science’ : 65,
‘English’ : 88}
}
1.
2.
3.
4.
5.
6.
7.
print
登录后复制

本文介绍了Python数据分析库pandas的基础和重要性,并推荐了Pandas Profiling工具进行高效的数据探索。此外,还展示了如何使用pprint模块以更清晰的方式打印数据结构。文章还提到了一系列Python数据分析视频教程,涵盖从基础到进阶的内容。
最低0.47元/天 解锁文章
1891

被折叠的 条评论
为什么被折叠?



