tensorflow中Dataset读数性能测试

最新推荐文章于 2024-11-21 11:47:52 发布

wjj547670933

最新推荐文章于 2024-11-21 11:47:52 发布

阅读量597

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wjj547670933/article/details/87912639

版权

本文对比了使用Python标准文件读取方式与TensorFlow的Dataset API读取500万条数据的性能。结果显示，Python读取速度极快，而TensorFlow的Dataset在加入shuffle后耗时增加约50%。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先我们随机生成一批数据文件;

可以看到我们总共生成了500万条数，均匀分到20个文件中，全部数据大约220M。

现在，我们用python中标准的文件读取方式读入数据，测试结果如下：

读入仅仅只需3秒。

我们接着重复读10次：

耗时31.6秒，大约是单遍读取时间的10倍。

接着我们用tensorflow的dataset试试看，测试结果如下：

可以看到耗时8秒。

下面让epoch为10再看看dataset的耗时：

耗时80秒，刚好是单个epoch的10倍。

下面加入shuffle且让epoch为10再看看dataset的耗时：

耗时122秒，可以发现shuffle会增加大约一半的耗时。至此，我们可以断定，在我们测试这种场景下dataset性能实在不怎么样。

博客等级

码龄16年

22
原创

7
点赞

42
收藏

5
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

stringstream与snprintf性能对比测试
xjr20042 回复玄道公子: 亲测，test_snprintf2 去掉memset之后是会快点，但还是比test_stringstream2慢点。 C++作者说过，C++的字符串函数比C的快些（不一定是全部函数），看来是真的。
CPU与GPU计算耗时对比
Kndy: CPU和GPU的型号介绍一下呗
stringstream与snprintf性能对比测试
玄道公子: 你这个代码对于test_snprintf2 这个用例有失偏颇，每次要memset 1024个字节，耗时肯定更多，如果取消掉memset，应该速度会更快一些吧
服务器性能调优-菜鸟初尝试
qq_38314767: shell截图里的是神马字体呀？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。