Python 处理 Excel (一)
环境准备
-
下载并安装 集成 python 环境 下载官网
- 点击下载
- python 3.6 或者 3.7 都可以
-
下载 pycharm ,代码编辑器,非常好用
-
测试环境是否稳定
- win + R, 输入,cmd,输入 python
- 如果报错,再开启一个 cmd,输入
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
pandas 基础使用指南
pandas 基础介绍
- pandas 集成了
xlwt
,xlrd
两个包,方便读写 - pandas 最重要的部分是批量处理数据,效率高,处理方便,非常适合机器学习的数据预处理
- 除此之外,pandas 支持大多数数据格式的导出,如数据库,txt,json格式,excel 等等
pandas 使用大致分为三步
是不是和把大象搬进冰箱一样
- 打开文件
- 处理数据
- 导出文件
1. 打开文件
df = pd.read_excel("1.xlsx", sheet_name=0)
- 如果报错显示,不支持 xlsx
- 卸载高版本的 xlrd
pip uninstall xlrd
- 安装低版本的 xlrd
pip install xlrd==1.2.0
- df 是 dataframe 的缩写,也就是数据帧
- sheet_name=0 表示读取第一个 sheet 的数据,以此类推
2. 处理数据
-
查看读出来的数据
print(df)
-
读取数据
- 建议查询文档,官方文档
# 读取第一行,不包括表头 df.iloc[0] # 读取前五行,不包括表头 df.head(5) # 获取班级 为1的学生 df.loc[df["班级"] == 1]
-
修改数据
# 班级为1的所有学生,分数改为 200 df.loc[df["班级"] == 1, "分数"] = 200
3. 导出数据
df.to_excel("2.xlsx", sheet_name="test_sheet")
- 数据导入到 sheet_name 为test_sheet, 文件名为 2.xlsx 的文件中