tensorflow list_files需要注意的点

文章讨论了在TensorFlow中使用list_files函数时遇到的正则表达式限制,仅支持文件名部分的匹配。尽管不支持目录正则,但通过输入路径列表或包含正则的路径字符串,仍能处理多个目录的文件读取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

tensorflow 读取tfrecord的时候 list_files几乎是避不开的函数,在tensorflow的官方文档中写了,list_files 支持正则表达式。

但是这里面有个比较坑的点:我们点开list_files的源码,会发现调用了gen_io_ops.matching_files。这个是tf.io.matching_files函数的底层算子,我们打开这个函数会发现一个注意事项

Note that this routine only supports wildcard characters in the basename portion of the pattern, not in the directory portion. Note also that the order of filenames returned is deterministic.

即该函数仅支持最后一层文件级别的正则表达式,而不支持目录的正则表达式。

不过这也不代表我们没办法读多个目录,list_files的入参可以是一个路径字符串,也可以是一个list,其中的每个元素都可以是一个路径正则表达式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值