自动化办公Panda的使用

最新推荐文章于 2024-07-12 16:41:07 发布

StarLightLu

最新推荐文章于 2024-07-12 16:41:07 发布

阅读量514

点赞数

分类专栏： python学习文章标签： python 数据分析

本文链接：https://blog.youkuaiyun.com/qq_44691287/article/details/117288612

版权

panda 专业来说是，基于Numpy的一个强大的分析结构化数据的工具集，可以快速实现数据清洗功能。而对我来说，panda同时也是一个强大的，自动化办公工具集，同时支持cvs、xlsx等多种格式文件的信息处理。用它处理表格数据是非常高效的！

提示：本文主要表述的是Python的Panda文档处理方法和使用技巧

一、安装与环境

pip install Pandas

pip install xlrd==1.2.0

如果报这个错误就是就是没有这个依赖库，且值得注意的是，要指定版本，不然最新版本，不支持xlsx文件

ImportError: Missing optional dependency 'xlrd'. Install xlrd >= 1.0.0 for Excel support Use pip or conda to install xlrd.

import pandas as pd
pd.read_excel("你本地的xlsx文件路径")

导入panda库，导入成功后，就可以通过简化后的pd名称调用，panda库的各种方法了

import pandas as pd

import pandas as pd
pd.read_csv("file.csv")

import pandas as pd
pd.read_excel("file.xlsx")

从这两个例子中可以看出，读取支持格式的文件，方法都会以read_.* 开头，所有想读取文件可以先输入read_ 查看提示选项。

pd.read_csv("file.csv", nrows=10) # 只将文件前10行加载入内存

这里主要介绍的，将内容展示到控制台，以及做一些处理，去除表格内容干扰！

import pandas as pd
data=pd.read_csv("file.csv")
print(data)