YouTube-8M 视频理解挑战赛开源项目教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01179/article/details/147323145

YouTube-8M 视频理解挑战赛开源项目教程

youtube8mchallenge 1st place solution to Kaggle's 2018 YouTube-8M Video Understanding Challenge 项目地址: https://gitcode.com/gh_mirrors/yo/youtube8mchallenge

1. 项目介绍

本项目是基于 Kaggle 的 YouTube-8M 视频理解挑战赛的第一名解决方案。该挑战赛要求参赛者对 YouTube-8M 数据集中的视频进行分类，识别出视频中的标签。本项目提供了一个端到端的解决方案，包括模型训练、评估、模型量化和图组合等步骤。

项目使用了 TensorFlow 框架，并借鉴了多个著名的研究成果。代码遵循 Apache-2.0 许可协议发布，可供研究、学习和进一步开发使用。

2. 项目快速启动

在开始之前，请确保您的环境中已安装了 Python 2.7 和 TensorFlow 1.8.0。

环境准备

# 设置 CUDA 可见设备
export CUDA_VISIBLE_DEVICES=0

# 设置训练和保存路径
SAVEPATH="../trained_models"
RECORDPAT="../data/frame/train"

训练模型

python train.py \
--train_data_pattern="$RECORDPAT/*.tfrecord" \
--model=NetVLADModelLF \
--train_dir="$SAVEPATH/NetVLAD" \
--frame_features=True --feature_names="rgb,audio" \
--feature_sizes="1024,128" \
--batch_size=160 --base_learning_rate=0.0002 \
--netvlad_cluster_size=256 \
--netvlad_hidden_size=1024 \
--moe_l2=1e-6 --iterations=300 \
--learning_rate_decay=0.8 \
--netvlad_relu=False \
--gating=True \
--moe_prob_gating=True \
--lightvlad=False \
--num_gpu 1 \
--num_epochs=10

评估模型

RECORDPATVAL="../data/frame/train"
python eval.py \
--eval_data_pattern="$RECORDPATVAL/*.tfrecord" \
--model=NetVLADModelLF \
--train_dir="$SAVEPATH/NetVLAD" \
--frame_features=True --feature_names="rgb,audio" \
--feature_sizes="1024,128" \
--batch_size=160 \
--base_learning_rate=0.0002 \
--netvlad_cluster_size=256 \
--netvlad_hidden_size=1024 \
--moe_l2=1e-6 --iterations=300 \
--learning_rate_decay=0.8 \
--netvlad_relu=False \
--gating=True \
--moe_prob_gating=True \
--lightvlad=False \
--num_gpu 1 \
--num_epochs=10 \
--run_once \
--build_only \
--sample_all