pandas处理Excel

生成数据表

1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:

import numpy as np 
import pandas as pd

2、导入CSV或者xlsx文件:

data = pd.read_csv(‘name.csv’,header=1)  默认读取第一个sheet

data = pd.read_csv(‘name.csv’,sheet_name='sheetName') 根据sheet名获取sheet

data = pd.read_csv(‘name.csv’,sheet_name=None) 获取所有sheet,data.keys()获取所有sheet_name 列表。

3用pandas创建数据表:

df = pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006], 
 "date":pd.date_range('20130102', periods=6),
  "city":['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '],
 "age":[23,44,54,32,34,32],
 "category":['100-A','100-B','110-A','110-C','210-A','130-F'],
  "price":[1200,np.nan,2133,5433,np.nan,4432]},
  columns =['id','date','city','category','age','price'])

4:读取指定的单行,数据会存在列表里面

#1:读取指定行
df=pd.read_excel('lemon.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=df.ix[0].values#0表示第一行 这里读取数据并不包含表头,要注意哦!
print("读取指定行的数据:\n{0}".format(data))
上边的ix已经被废弃,用下边的代替
df.loc[:, ['B', 'A'] 或者 df.iloc['a', 'b']

2:读取指定的多行,数据会存在嵌套的列表里面:

df=pd.read_excel('lemon.xlsx')
data=df.ix[[1,2]].values#读取指定多行的话,就要在ix[]里面嵌套列表指定行数
print("读取指定行的数据:\n{0}".format(data))

3:读取指定的行列:

df=pd.read_excel('lemon.xlsx')
data=df.ix[1,2]#读取第一行第二列的值,这里不需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))

4:读取指定的多行多列值:

df=pd.read_excel('lemon.xlsx')
data=df.ix[[1,2],['title','data']].values#读取第一行第二行的title以及data列的值,这里需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))

5:获取所有行的指定列

df=pd.read_excel('lemon.xlsx')
data=df.ix[:,['title','data']].values#读所有行的title以及data列的值,这里需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))

6:获取行号并打印输出

df=pd.read_excel('lemon.xlsx')
print("输出行号列表",df.index.values)

输出结果是:
输出行号列表 [0 1 2 3]

7:获取列名并打印输出

df=pd.read_excel('lemon.xlsx')
print("输出列标题",df.columns.values)

运行结果如下所示:
输出列标题 ['case_id' 'title' 'data']

8:获取指定行数的值:

 

df=pd.read_excel('lemon.xlsx')
print("输出值",df.sample(3).values)#这个方法类似于head()方法以及df.values方法

输出值
 [[2 '输入错误的密码' '{"mobilephone":"18688773467","pwd":"12345678"}']
 [3 '正常充值' '{"mobilephone":"18688773467","amount":"1000"}']
 [1 '正常登录' '{"mobilephone":"18688773467","pwd":"123456"}']]

 

9:获取指定列的值:

df=pd.read_excel('lemon.xlsx')
print("输出值\n",df['data'].values)

 

### 使用 Pandas 处理 Excel 文件 Pandas 提供了强大的功能来读取和写入 Excel 文件。以下是关于如何使用 `pandas` 进 Excel 数据处理的具体方法。 #### 1. 安装依赖库 为了能够正常运涉及 Excel 的操作,需要安装必要的库: ```bash pip install pandas openpyxl xlrd ``` 其中,`openpyxl` 和 `xlrd` 是用来支持不同版本的 Excel 文件(`.xlsx` 和 `.xls`)的解析器[^4]。 --- #### 2. 读取 Excel 文件 可以利用 `pd.read_excel()` 函数轻松加载 Excel 中的数据表: ##### 示例代码:读取单个 Sheet 表格 ```python import pandas as pd # 加载名为 'example.xlsx' 的文件,并指定要读取的工作表名称为 'Sheet1' df = pd.read_excel('example.xlsx', sheet_name='Sheet1') # 打印 DataFrame 结果 print(df) ``` 上述代码展示了如何通过指定工作表名的方式读取特定表格的内容[^1]。 如果未提供 `sheet_name` 参数,则默认会读取第一个工作表中的数据[^3]。 --- #### 3. 写入 Excel 文件 同样地,可以通过 `DataFrame.to_excel()` 方法将数据保存至 Excel 文件中。 ##### 示例代码:将 DataFrame 写入新的 Excel 文件 ```python import pandas as pd # 创建一个简单的 DataFrame 对象 data = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]} df = pd.DataFrame(data) # 将其导出到一个新的 Excel 文件 df.to_excel('output.xlsx', index=False, engine='openpyxl') ``` 这里需要注意的是,在调用 `to_excel()` 方法时需设置参数 `index=False` 来防止额外索引列被写入文件;另外还需要显式指明所使用的引擎类型(如 `'openpyxl'`),以便兼容不同的 Excel 格式。 --- #### 4. 高级应用——多 Sheets 操作 当面对复杂的场景比如多个 sheets 同步存取的时候也可以借助于字典结构完成批量化的管理流程。 ##### 示例代码:一次性读取所有 Sheets 并存储在一个字典里 ```python all_sheets_data = pd.read_excel('multi_sheet_file.xlsx', sheet_name=None) for name, frame in all_sheets_data.items(): print(f'Sheet Name: {name}') print(frame.head()) ``` 此段脚本实现了遍历整个文档内的每一个子页签并逐一打印前几条记录作为预览展示[^2]。 --- #### 总结说明 综上所述,无论是基础还是高级需求下,Pandas 均提供了简洁高效的解决方案帮助开发者便捷高效地完成针对电子表格类资料的各项任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值