读取文件目录汇总为表的代码如下
import os
import pandas as pd
def generate_table(root_dir):
data = []
for app_dir in os.listdir(root_dir):
app_path = os.path.join(root_dir, app_dir)
if not os.path.isdir(app_path):
continue
for page_dir in os.listdir(app_path):
page_path = os.path.join(app_dir,page_dir)
if not os.path.isdir(page_path):
continue
for file_name in os.listdir(page_path):
if not file_name.endswith('.png'):
continue
data.append([app_dir,page_dir,file_name])
df= pd.DataFrame(data, columns=['第一级目录','第二级目录','文件名']
return df
root_dir = '/data/img'
df = generate_table(root_dir)
print(df)
基于汇总好的表格,统计不同第一级目录对应文件数量
result= df.groupby(['第一级目录']).agg({'文件名':'count'})
print(result)