TensorFlow发布1.12.0版本，改善XLA稳定性和性能

最新推荐文章于 2023-04-04 17:45:04 发布

糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖糖

最新推荐文章于 2023-04-04 17:45:04 发布

阅读量256

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/cpongo4/article/details/89118701

TensorFlow最新版本1.12.0发布，新增多项功能改进，包括Keras模型直接导出为SavedModel格式，支持tf.data.Dataset评估，改进XLA稳定性和性能，修复多个错误。此外，C++代码移至tensorflow::data命名空间，增强TPUEstimator数据集迭代器初始化，Keras在TPU上表现更佳。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

AI前线导读： 近日，TensorFlow发布1.12.0版本，对主要功能进行了一些改进，并修复了一些错误，如Keras模型现在可以直接导出为SavedModel格式等。

主要功能和改进

Keras模型现在可以直接导出为SavedModel格式（tf.contrib.saved_model.save_keras_model（））并与Tensorflow服务一起使用。
Keras模型现在支持使用tf.data.Dataset进行评估。
TensorFlow二进制文件在默认链接的XLA支持下构建。
Ignite Dataset添加到contrib / ignite，它允许使用Apache Ignite。

错误修复和其他更改

tf.data：
- tf.data用户现在可以分别使用tf.data.Options（），tf.data.Dataset.options（）和tf.data.Dataset.with_options（）来表示、获取和设置TensorFlow输入管道的选项。
- 新的tf.data.Dataset.reduce（）API允许使用用户提供的reduce函数将有限数据集缩减为单个元素。
- 新的tf.data.Dataset.window（）API允许用户创建输入数据集的有限窗口；当与tf.data.Dataset.reduce（）API结合使用时，这允许用户实现自定义批处理。
- 所有C ++代码都移动到tensorflow :: data命名空间。
- 添加对num_parallel_calls的支持到tf.data.Dataset.interleave。
tf.contrib：
- 删除tf.contrib.linalg。使用tf.linalg代替。
- 用meta_graph_def.signature_def [signature_def_key]替换对tf.contrib.get_signature_def_by_key（metagraph_def，signature_def_key）的任何调用。通过捕获KeyError异常代替捕获tf.contrib.get_signature_def_by_key产生的ValueError异常。
tf.contrib.data
- 弃用，并用tf.data.experimental替换。
其他：
- 改善XLA稳定性和性能。
- 修复Cloud ML Engine中的单个副本TensorBoard摘要统计信息。
- TPUEstimator：并行初始化数据集迭代器。
- Keras对TPU模型质量和错误修复。
- 恢复使用系统malloc，而不是jemalloc，因为它简化了构建且性能相当。
- 从tf.nn.softplus和tf.nn.softsign OpDefs中删除整数类型。这是一个错误修正；这些操作从来都不是为了支持整数。
- 允许使用单个维度对张量进行子句划分。
- 添加选项以Unicode字符计算字符串长度
- 向SubSlice添加一个张量的功能。
- 添加searchsorted（即lower / upper_bound）op。
- 为Boosted Trees添加模型可解释性。
- 支持tf.substr的negative positions
- 之前在bijector_impl中存在一个错误，其中_reduce_jacobian_det_over_event无法正确处理标量ILDJ实现。
- 在eager execution中，允许重新进入GradientTape上下文
- 添加tf_api_version标志。如果传入了–define = tf_api_version = 2标志，那么bazel将构建TensorFlow API 2.0版本。请注意，TensorFlow 2.0正在积极开发中，目前还无法保证发布。
- 向TfRecordWriter添加其他压缩选项
- 正则表达式完全匹配操作的性能改进。
- 用tf.GraphKeys.GLOBAL_VARIABLES替换tf.GraphKeys.VARIABLES
- 删除未使用的动态学习速率支持