tensorflow 高效代码

最新推荐文章于 2024-06-23 07:00:00 发布

原创最新推荐文章于 2024-06-23 07:00:00 发布 · 168 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

博客介绍了设计数据读入pipeline最佳流水线的做法，包括使用prefetch转换重叠工作、并行处理map变换、使用map_and_batch混合转换、用parallel_interleave转换重叠读取操作、减少内存使用以及合理使用shuffle和repeat转换等，还给出了参考链接。

设计数据读入pipeline最佳流水线做法是：

1，使用prefetch转换可将提供和使用方的工作重叠，特别建议将prefetch(n)（其中n是单步训练使用的元素/批次数）添加到输入流水线的末尾，以便将在CPU上执行的转换在加速器上执行的训练重叠

2，通过设置num_parallel_calls参数并行处理map变换，建议直接设置为CPU核心的数量

3，如果使用batch转换将预处理元素组合到一个批次中，建议使用map_and_batch混合转换，如果在使用批次比较大的时候

4，如果您要处理远程存储的数据并需要反序列化，建议使用parallel_interleave转换来重叠从不同文件读取数据的操作

5，如果预处理会增加数据大小，建议首先使用interleave,prefetch和shuflle来减少内存使用

6，建议在使用repeat转换之前，用shuffle转换，最好使用shuffle_and_repeat混合转换

转自：https://www.tensorflow.org/guide/performance/datasets?hl=zh-cn#pipelining

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。