在做数据预处理的时候, 先是在local实现, 使用了os去获取单个文件夹下所有文件的路径然后去处理.
def get_file_list(mainfile):
path_list = []
for doc in os.listdir(mainfile):
newpath = os.path.join(mainfile, doc)
<
在AWS Sagemaker上进行数据预处理时,由于S3中不存在传统意义上的文件夹,需要通过特定方式获取文件路径。本文介绍了如何在S3中使用prefix获取相关key的文件路径,并在处理过程中去除根目录的对象。分享了从S3 bucket获取文件路径的技巧,并邀请读者交流讨论。
在做数据预处理的时候, 先是在local实现, 使用了os去获取单个文件夹下所有文件的路径然后去处理.
def get_file_list(mainfile):
path_list = []
for doc in os.listdir(mainfile):
newpath = os.path.join(mainfile, doc)
<

被折叠的 条评论
为什么被折叠?