tensorflow feature column

本文介绍了通过TensorFlow预定义的feature column实现特征处理的功能及工作流程。还阐述了feature column类型,包括常用的9种用于特征处理的类型,以及常用操作,如dense column可输入模型,category column的相关转换等,此外还提及了sequence tensor的处理方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

功能

通过tensorflow 预定义的feature column 达到特征处理的功能.
工作流程:

  1. tesnsorflow dataset 产生迭代器返回解析后的tensor dict (即input_fn)
  2. 预定义 tensor dict 中(key, tensor) 的转化方式, 生成feature column
  3. 通过input_layer(feature_dict, feature_column) 生成转化后的feature 供模型使用
    1270903-20190317163504016-1976381398.png
    p.s. 官网图中的input_layer函数实际上是在DNNClassifier中. 因此feature_column只是类似于定义一个函数操作. 数据处理则在DNNClassifier model_fn中.

feature column 类型

1270903-20190317164030099-2117090345.png

常用feature column

官方提供了常用的9种(上图下层)feature column, 用于特征处理. 通过这九种操作最终都会得到 category column / dense column 对象.

常用操作

首先我们需要知道, 可以将tensor 处理, 并输入模型的只有dense column. categorical column 只是转化的中间结果.
其次:

  1. category column 可以输入cross_column 生成交叉后的category column
  2. category column 可以作为embedding column, indicator_column 的输入, 转换为dense column
  3. embedding_column 可以通过share_embedding_column共享参数.(操作见另一篇博客)

    其他操作

    tf.contrib.feature_column 中包含了关于sequence tensor 的处理方式. 与之对应需要通过sequence_input_layer进行解析

转载于:https://www.cnblogs.com/wuchengze/p/10547685.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值