1介绍
这是一个动作识别的paper,本文主要介绍实验环境怎么配置,以及如何运行作者的代码。代码使用python写的,用起来不难,但因为是第一次接触python,遇到了一些问题,就记录下来。
作者是把场景分类的object bank方法应用到video。分类准确率高,而且作者给出的代码可以直接运算出一个video片段的特征,然后直接就可以训练分类器。
2实验环境步骤
KTH数据集的准率是98.2%,UCT-sport数据集准确率是95.0%。paper里用的是linear svm。可见性能还是很不错的。下面说明我在windows7下部署环境的步骤和问题。
1、下载Python 2.7.3,选择64位版本的。由于程序的运行需要占用很大的内存,32位Python会造成memory error。
网址:https://www.python.org/download/releases/2.7.3/,并且把python的根目录添加到path里面。
2、安装依赖项numpy和scipy,这是科学计算的库。安装的版本需要是64位的,可以选择安装非官方的第三方扩展,
网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/。
3、如果安装第三方库时,提示“python 2.7 was not found in the registry ”,表明系统找不到Python的路径。可以参考方法:
http://www.cfanz.cn/index.php?c=article&a=read&id=74416
http://www.th7.cn/Program/Python/201412/334345.shtml
然后再安装库,就应该没问题了
4、安装ffmpeg。这是开源的处理视频的库。这里我们只需要利用编译好的二进制文件和可执行文件即可。
网址:http://ffmpeg.zeranoe.com/builds/,选择下载64位的“shared”版本的ffmped。然后把根目录下的bin文件夹的地址添加的path。
5、安装Matplotlib,选择64位版本的。Matplotlib库需要安装pyparsing,也是64位的。
网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/。
6、其他依赖项:setuptools,dateutil等。安装setuptools之后,把Python目录下的scripts文件夹的目录添加到path。然后在命令行下,运行easy_install python-dateutil。
3时间花销
作者主页上,有FAQ,有计算1个video的特征的方法。也可参考代码里面的readme文件。
比较郁闷的是,计算的时间代价太大了。作者在4核的机器上,计算一个3秒的视频的特征,花费了1个多小时。我自己在一个8核的机子上实验,也花费了20多分钟。
参考文献:Action Bank A High-Level Representation of Activity in Video
主页:http://www.cse.buffalo.edu/~jcorso/r/actionbank/
欢迎登陆我的个人主页,hello2019,查看原文:http://richardliu.cn/