tensorflow 建个小图

本文介绍使用TensorFlow创建CSV数据集的方法,并演示如何从数据集中收集唯一词汇以构建词汇表。通过定义输入函数和利用TensorFlow图,文章详细解释了处理流程,包括错误处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

def Dataset(file_pattern, batch_size, num_epochs=1):
    logging.info('Creating Dataset from %s', file_pattern)
    return tf.data.experimental.make_csv_dataset(
        file_pattern=file_pattern,
        batch_size=batch_size,
        label_name=LABEL_NAME,
        num_epochs=num_epochs,
        num_rows_for_inference=10
    )

input_fn = Dataset(expanded, FLAGS.batch_size)

def collect_unique_tokens(input_fn):
    logging.info('Creating vocabulary...')
    vocabulary_dict = {item: set() for item in CATEGORICAL_COLUMNS}
    graph = tf.Graph()
    with graph.as_default():
        iterator = input_fn().make_one_shot_iterator()
        t_features, t_labels = iterator.get_next()
    with tf.Session(graph=graph) as sess:
        while True:
            try:
                features, _ = sess.run([t_features, t_labels])
                for item in CATEGORICAL_COLUMNS:
                    for value in features[item]:
                        vocabulary_dict[item].add(value)
            except tf.errors.OutOfRangeError:
                break
    return vocabulary_dict
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值