Python解析excel

本文介绍了如何使用Python的xlrd模块来操作Excel文件。主要内容包括xlrd模块的安装步骤、基本使用方法,如读取Excel文件、获取工作表、读取特定单元格等,并提供了实用的示例代码。

1、安装xlrd模块

   到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。

二、使用介绍

  1、导入模块

      import xlrd

   2、打开Excel文件读取数据

       data = xlrd.open_workbook('excelFile.xls')

   3、使用技巧

        获取一个工作表

 

        table = data.sheets()[0]          #通过索引顺序获取
 
         table = data.sheet_by_index(0) #通过索引顺序获取

 

        table = data.sheet_by_name(u'Sheet1')#通过名称获取
 
        获取整行和整列的值(数组)
   
         table.row_values(i)
 
         table.col_values(i)
 
        获取行数和列数
  
        nrows = table.nrows
 
        ncols = table.ncols
       
         循环行列表数据
        for i in range(nrows ):
      print table.row_values(i)
 
单元格
cell_A1 = table.cell(0,0).value
 
cell_C4 = table.cell(2,3).value
 
使用行列索引
cell_A1 = table.row(0)[0].value
 
cell_A2 = table.col(1)[0].value
 
简单的写入
row = 0
 
col = 0
 
# 类型 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
ctype = 1   value = '单元格的值'
 
xf = 0  # 扩展的格式化
 
table.put_cell(row, col, ctype, value, xf)
 
table.cell(0,0)  #单元格的值'
 
table.cell(0,0).value #单元格的值'
 

 

三、Demo代码

   Demo代码其实很简单,就是读取Excel数据。

   

复制代码
 1 # -*- coding: utf-8 -*- 
2 import xdrlib ,sys
3 import xlrd
4 def open_excel(file= 'file.xls'):
5 try:
6 data = xlrd.open_workbook(file)
7 return data
8 except Exception,e:
9 print str(e)
10 #根据索引获取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的所以 ,by_index:表的索引
11 def excel_table_byindex(file= 'file.xls',colnameindex=0,by_index=0):
12 data = open_excel(file)
13 table = data.sheets()[by_index]
14 nrows = table.nrows #行数
15 ncols = table.ncols #列数
16 colnames = table.row_values(colnameindex) #某一行数据
17 list =[]
18 for rownum in range(1,nrows):
19
20 row = table.row_values(rownum)
21 if row:
22 app = {}
23 for i in range(len(colnames)):
24 app[colnames[i]] = row[i]
25 list.append(app)
26 return list
27
28 #根据名称获取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的所以 ,by_name:Sheet1名称
29 def excel_table_byname(file= 'file.xls',colnameindex=0,by_name=u'Sheet1'):
30 data = open_excel(file)
31 table = data.sheet_by_name(by_name)
32 nrows = table.nrows #行数
33 colnames = table.row_values(colnameindex) #某一行数据
34 list =[]
35 for rownum in range(1,nrows):
36 row = table.row_values(rownum)
37 if row:
38 app = {}
39 for i in range(len(colnames)):
40 app[colnames[i]] = row[i]
41 list.append(app)
42 return list
43
44 def main():
45 tables = excel_table_byindex()
46 for row in tables:
47 print row
48
49 tables = excel_table_byname()
50 for row in tables:
51 print row
52
53 if __name__=="__main__":
54 main()
复制代码
Python中,有多种方法可以解析Excel文件,不同场景下可选用不同库和方法: ### 使用 `xlrd` 库解析 可导入 `xlrd` 库读取Excel文件,并导入 `datetime` 模块处理日期转换。打开工作簿后,遍历工作表,每个工作表保存为单独的CSV文件。从第二行开始遍历行以跳过表头,若单元格包含日期,将其从Excel日期格式转换为Python的 `datetime` 对象,最后将每个单元格值转换为字符串,用 `|` 连接成字符串写入以 `|` 为分隔符的CSV文件。示例代码如下: ```python import xlrd from datetime import datetime # 假设 save_path 是 Excel 文件路径,to_csv_path 是保存 CSV 的路径 save_path = 'your_excel_file.xlsx' to_csv_path = 'your_csv_path' wb = xlrd.open_workbook(save_path) number_of_sheets = wb.nsheets for sheet_index in range(number_of_sheets): sheet = wb.sheet_by_index(sheet_index) print(f"Sheet Name: {sheet.name}, Rows: {sheet.nrows}, Columns: {sheet.ncols}") csv_filename = f"{to_csv_path}_{sheet_index}.csv" with open(csv_filename, 'w', encoding='utf-8') as csv_file: for row_index in range(1, sheet.nrows): # 从第二行开始跳过表头 row_values = [] for col_index in range(sheet.ncols): cell = sheet.cell(row_index, col_index) if cell.ctype == xlrd.XL_CELL_DATE: date_value = xlrd.xldate_as_datetime(cell.value, wb.datemode) row_values.append(str(date_value)) else: value = str(cell.value).replace('\n', ' ').replace('\t', ' ') row_values.append(value) row_str = '|'.join(row_values) csv_file.write(row_str + '\n') ``` 此方法适用于将Excel文件转换为多个CSV文件的场景,且能处理日期格式转换 [^2]。 ### 使用 `openpyxl` 库读取单元格数据 可以使用 `openpyxl` 中的 `load_workbook` 模块获取表格的工作簿对象,通过sheet名称获取表单,再通过 `cell` 获取单元格,最后使用 `cell.value` 获取单元格数据。示例代码如下: ```python from openpyxl import load_workbook # 假设 excel_file_path 是 Excel 文件路径 excel_file_path = 'your_excel_file.xlsx' wb = load_workbook(excel_file_path) sheet = wb['Sheet1'] # 假设表单名为 'Sheet1' cell = sheet.cell(row=1, column=1) cell_value = cell.value print(cell_value) ``` 这种方法适合精确读取指定单元格数据的场景 [^3]。 ### 另一种 `xlrd` 读取方式 使用 `xlrd` 打开Excel文件,获取表单名字,通过表单名获取指定表单对象,最后遍历单元格获取值。示例代码如下: ```python import xlrd # 假设文件和代码在同一目录下 wb = xlrd.open_workbook('your_excel_file.xls') sheetnames = wb.sheet_names() sheet = wb.sheet_by_name(sheetnames[0]) for row in range(sheet.nrows): for col in range(sheet.ncols): value = sheet.cell(row, col).value print(value) ``` 此方法适用于遍历整个工作表获取所有单元格值的场景 [^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值