tf-serving docker 中批处理配置的踩坑

最新推荐文章于 2024-01-12 09:38:54 发布

原创

最新推荐文章于 2024-01-12 09:38:54 发布 · 1.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#tensorflow #后端

本文介绍TF-Serving中批处理请求的配置方法，重点讲解序列数据批处理时的序列填充(padding)技巧，并分享如何手动预填充数据以控制填充值。

tf-serving 官方文档中，关于批处理请求，指南如下：

关键点在于：

1. 启用批处理请求 --enable_batching=True

2. 配置批处理文件如上图所示内容

这里有个坑在于，如果批处理的请求是序列数据（nlp场景，或ocr场景下），是可以自动做序列padding的，需要加上额外的配置，这个要看它github 上的源码是做了这样的修改的。

3. 在启动了序列pad后，这里padding的方式是默认在序列末尾添加padding (末尾)，这个并不能主观设置。

4. padding 值选取，这里由于官方并没有给出可配置的选项，所以根据这个帖子：

https://github.com/tensorflow/serving/issues/1279

padding 值选取为收到seq 数据请求的第一个值，所以本人在处理这个问题时，为了统一控制padding值，

只能自己在发请求前人为将数据按时间维先padding 一次，我这里的padding值指定为999：

input_1_with_padding = np.ones((input_data_1.shape[0], input_data_1.shape[1]+1,

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

chenxin0215 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。