End-to-end Face Detection and Cast Grouping in Movies Using Erdos-Renyi Clustering

本文介绍了一种结合人脸检测和跟踪的高质量人脸轨迹获取方法,提出了基于Erdos-Renyi图理论的聚类算法及新的验证方法rank-1countsverification,定义了端到端的人脸检测和聚类评价标准,使用Faster R-CNN和distribution field tracker进行检测与跟踪,并通过实验数据集验证了其有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

三个创新点

  1. 将人脸检测和跟踪结合起来得到高质量的人脸轨迹
  2. 提出一种基于Erdos-Renyi图理论的聚类算法(It is based on the observations that large clusters can be fully connected by joining just a small fraction of their point pairs, while just a single connection between two different people can lead to poor clustering results.)。提出新的验证方法rank-1 counts verification,用误报率小的验证系统修正召回率。
  3. 定义一种端到端的人脸检测和聚类评价标准。

检测和跟踪

  • 检测用Faster R-CNN,在WIDER face data数据集重新训练
  • distribution field tracker,不用再训练
  • 检测和跟踪的结合方法(感觉就是Sort啊^ ^):
    • 每帧都检测
    • IoU阈值0.3
    • 匈牙利算法进行多目标匹配
    • 检测与跟踪未匹配上,新建一个tracklet
    • 跟踪与检测未匹配上,保留α=10帧

Erdos-Renyi Clustering 和 rank-1 counts verification

  • Erdos-Renyi图论
    • 设图G,有n个顶点,每条边出现的概率p,则期望的边数为 (n2)p\left ( \frac{n}{2} \right )p(2n)p,当ϵ>0\epsilon >0ϵ>0且n足够大时,若p>(1+ϵ)lnnnp>\frac{\left ( 1+\epsilon \right )ln n}{n}p>n(1+ϵ)lnn则G一定是连通图。
  • 人脸验证系统(focus on low false positives rather than high recall)
    • 提取fc7 layer 的4096维特征
    • 参考集G=50张图,对应特征:R1,R2,R3,...,RGR^{1},R^{2},R^{3},...,R^{G}R1,R2,R3,...,RG
    • R=∑i=14096I[∣Ai−Bi∣&lt;min⁡j∣∣Ai−Rij∣]R=\sum_{i=1}^{4096}I\left [ \left |A _{i}-B_{i} \right |&lt;{\min_{j}}\left | |A _{i}-R_{i}^{j} \right | \right ]R=i=14096I[AiBi<jminAiRij]I[.]是指示函数(二值0或1)
    • 自动测定rank-1 counts阈值。(We do this by fitting the left half of the LFW distribution to the left half of the clustering distribution using scale and location parameters)
    • 每条轨迹随机选取10张图片计算R值,取最大值
    • 参考图库:G=1000,g=50
  • do-not-link 限制(硬制约)
    • 同一帧的两个人不是同一个人
    • 两条轨迹在时间上有任何的重叠,则为两条不同的轨迹

实验数据集

  • the big bang theory(BBT) s01e01-s01e06 5-8人
  • buffy the vampire slayer(Buffy) s05e01-s05e06 6-11人 有遮挡
  • hannah and her sisters(hannah)235人 有遮挡
  • LFW 5730 subjects

评价标准

  • annotations:{a1,a2,...,aA}\left \{ a_1,a_2,...,a_A\right \}{a1,a2,...,aA},detections:{d1,d2,...,dD}\left \{ d_1,d_2,...,d_D\right \}{d1,d2,...,dD}

  • false positives resulting from unannotated face detections{di,ϕ}\left \{ d_i,\phi \right \}{di,ϕ}检测到未标记的数据

  • valid face detections{di,aj}\left \{ d_i,a_j \right \}{di,aj}有效的检测

  • false negatives resulting from unmatched annotations{ϕ,aj}\left \{ \phi,a_j \right \}{ϕ,aj}未检测到标记的数据

  • -----------{di,ϕ}\left \{ d_i,\phi \right \}{di,ϕ} false positive------------------------{di,aj}\left \{ d_i,a_j \right \}{di,aj}True positive------------------{ϕ,aj}\left \{ \phi,a_j \right \}{ϕ,aj}false nagtive
    --------10-------
    1greenwhitecyanred
    0greenmagentabluered
  • unified pairwise precision(UPP)

    • {di,aj}\left \{ d_i,a_j \right \}{di,aj} within all clusters with matching identities
    • UPP=whitewhite+cyan+greenUPP=\frac{white}{white+cyan+green}UPP=white+cyan+greenwhite
  • unified pairwise recall(UPR)

    • within all identities that have been properly clustered
    • UPP=whitewhite+magenta+redUPP=\frac{white}{white+magenta+red}UPP=white+magenta+redwhite
  • 加权调和平均数 F-measure:Fα=1αUPP+1−αUPRF_\alpha =\frac{1}{\frac{\alpha}{UPP}+\frac{1-\alpha}{UPR}}Fα=UPPα+UPR1α1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值