pandas处理excel

最新推荐文章于 2024-08-26 22:31:41 发布

原创最新推荐文章于 2024-08-26 22:31:41 发布 · 277 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python #数据分析

python 专栏收录该内容

13 篇文章

订阅专栏

这篇博客介绍了如何使用Python的pandas库进行数据读取、文件写入、单元格判断和数据选择。首先，通过`pd.read_excel()`读取Excel文件。接着，创建一个新的xlsx文件并利用`ExcelWriter`将数据写入DataFrame。然后，展示了如何检查DataFrame中单元格是否为空。最后，演示了如何获取DataFrame的行数、索引以及如何选取特定行和列的数据。

import pandas as pd
import numpy as np

1、读取文件

data = pd.read_excel(path)

2、新建一个xlsx文件并写入一个dataframe

writer = pd.ExcelWriter("/home/kesai/inceptio/projects_server/zhenqi/20220428/dms-server_backup/frequency_video_2022-03-31_1.xlsx")   # 新建xlsx文件。
temp = []
for path in all_path.glob("**/*"):
    path = str(path)
    if path.endswith('.mp4'):  
        url_path = path
        results = tis_infer(url_path, mode='oracle')
        print(results[0]['FREQ'])
        temp.append([path, results[0]['FREQ']])            
df = pd.DataFrame(data=temp, columns=['videos', 'freq score'])
df.to_excel(writer, sheet_name='Sheet1', index=False)  # 写入文件的Sheet1
writer.save()

3、判断某个单元格是否为空

for i,rows in data.iterrows():
    print(type(data.loc[i,'在读']) == float)
    print(data.loc[i,'在读']is np.nan)

4、读取行数及索引

print(len(df.index.values))		# 行数 （不包含表头）
print(df.index.values)			# 行索引 
print(len(df.columns.values))	# 列数
print(df.columns.values)		# 列索引

#以下返回的都是numpy.ndarray
data = df.loc[0].values			# 第0行数据
data = df.loc[[1, 2]].values	# 读取多行数据（这里是第1行和第2行）

data = df.iloc[0].values		# 第0列数据
data = df.iloc[[1, 2]].values	# 读取多列数据（这里是第1列和第2列）