
tensorflow
qq_32110859
这个作者很懒,什么都没留下…
展开
-
tensorflow总结
最近的工作主要围绕tensorflow分布式(ps-worker,horovod)的改造,连最基本的模型搭建以及损失函数等都忘记了。出了问题都不知道该从何查起,做如下总结。一、目前遇到的问题: imagenet 数据集训练alexnet模型,模型loss输出一直固定在6.9左右。已经查过以下问题。模型的参数随着训练过程在变化 将模型输入设置为全白图片,检查模型输出l...原创 2018-09-13 15:44:16 · 319 阅读 · 0 评论 -
tensorflow base64字符串字符替换中出现的问题
import tensorflow as tfimport tensorflow.contrib.eager as tfetfe.enable_eager_execution() image = tf.gfile.GFile('/export/App/preserver/base64_dog2.txt').read()image =...原创 2018-12-26 19:22:35 · 930 阅读 · 0 评论 -
tf_serving
1 tf_serving 需要算法提供的主要有三个东西: a:模型pb文件 b:上线所需client文件首先:pb文件需要用tf.saved_model相关models生成。tf.saved_model.builder.SavedModelBuilder().add_meta_graph_and_variables()中signature_def_map中对于clas...原创 2018-12-10 17:55:22 · 1226 阅读 · 0 评论 -
tf.image.resize_bilinear vs cv2.resize
最近做项目,涉及到tf_serving.之前考虑将image预处理放在serving过程中做,但是遇到大图片时耗时过长的问题。所以将预处理移出pb文件,用java掉opencv完成。遇到问题:统一图片java做预处理和tf.image做预处理的预测结果不一致(一百张图片中有1~2张预测结果不一致)。google之后看到相关issue及blog。https://hackernoon....原创 2019-01-09 11:38:45 · 2376 阅读 · 4 评论 -
tf.train.ExponentialMovingAverage
https://www.tensorflow.org/versions/r1.13/api_docs/python/tf/train/ExponentialMovingAverage#top_of_page通过乘以一个指数衰减,保留变量的moving average训练模型时,保留训练变量的moving average是有用的。平均的参数做验证的效果要优于直接用final trained的...原创 2019-01-29 11:35:50 · 365 阅读 · 0 评论 -
attention_ocr源码
主要看sequence_layers.py这个脚本中才是实现了attention+decoder的部分,model中只是个架子。 sequence_layer中也是直接调用了TF的api,如果想深入理解,还是需要看TF源码。先从sequence_layer入手。AttentionWithAutoregression继承了Attention,Attention继承了SequenceLayerBa...原创 2019-09-03 15:48:02 · 652 阅读 · 0 评论