[tensorflow]tf.estimator.Estimator构建tensorflow模型

最新推荐文章于 2022-12-09 11:24:23 发布

原创

最新推荐文章于 2022-12-09 11:24:23 发布 · 2.7k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#tensorflow #estimator #模型

本文详细介绍了如何使用TensorFlow的Estimator API构建和管理机器学习模型，包括Estimator的概念、数据集处理、特征列定义、预创建与自定义Estimator的使用、模型的训练、评估和预测，以及模型的保存与恢复。通过实例展示了如何利用DNNClassifier、LinearClassifier等预创建Estimator进行模型训练，并探讨了自定义Estimator时的model_fn编写。

目录

一、Estimator简介

二、数据集

三、定义特征列

四、estimator创建模型

五、模型训练、评估和预测

六、模型保存和恢复

一、Estimator简介

Estimator是TensorFlow对完整模型的高级表示。Tensorflow提供一个包含多个API层的编程堆栈：

Estimator封装了操作：训练、评估、预测、导出以供使用。

二、数据集

通过tf.data模块，构建输入管道，将数据传送到模型中。tf.data模块返回的是Dataset对象，每个Dataset包含（feature_dict, labels）对。

https://blog.youkuaiyun.com/woniu201411/article/details/89249689

三、定义特征列

特征列视为原始数据和Estimator之间的媒介。要创建特征列，需要调用tf.feature_column模块的函数。

1、数值列

tf.feature_column.numeric_column将具有默认数据类型（tf.float32）的数值指定为模型输入。

2、分桶列

tf.feature_column.bucketized_column将数字列根据数值范围分为不同的类别（为模型中加入非线性特征，提高模型的表达能力）。

3、分类标识列

tf.feature_column.categorical_column_with_identity将每个分桶表示一个唯一整数，模型可以在分类标识列中学习每个类别各自的权重。

4、分类词汇列

tf.feature_column.categorical_column_with_vocabulary_list将字符串表示为独热矢量，根据明确的词汇表将每个字符串映射到一个整数。

tf.feature_column.categorical_column_with_vocabulary_file将字符串表示为独热矢量，根据文件中的词汇将每个字符串映射到一个整数。

5、经过哈希处理的列

tf.feature_column.categorical_column_with_hash_bucket将类别数量非常大的特征列，模型会计算输入的哈希值，然后使用模运算符将其置于其中一个hash_bucket_size类别中。

6、特征组合列

tf.feature_column.categorical_column_with_hash_bucket将任意分类列进行组合，但仅构建hash_bucket_size参数所请求的类别数量。

7、指标列和嵌入列

指标列（tf.feature_column.indicator_column）和嵌入列(tf.feature_column.embedding_column)将分类列视为输入。

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。