论文阅读B-CNN: Branch Convolutional Neural Network for Hierarchical Classification

最新推荐文章于 2024-05-16 09:27:51 发布

原创

最新推荐文章于 2024-05-16 09:27:51 发布 · 1.4k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#论文阅读 #cnn #人工智能 #python #tensorflow #分类 #机器学习

本文介绍了一种新的模型B-CNN，它利用CNN的层级结构进行图像层次分类，通过BT-strategy策略优化训练，显著提高了分类性能。B-CNN通过多层预测适应类别层次，避免了传统CNN的单一输出限制。

1.简介

B-CNN: Branch Convolutional Neural Network for Hierarchical Classification
Paper Github 代码
在这里插入图片描述
图像层次分类，利用CNN的层级结果与树形标签对应，来进行图像层次分类的。
使用数据集：MNIST、CIFAR-10和CIFAR-100
动机：
类与类之间往往存在一般-特定的分类排序属性，例如，猫和狗通常可以归为宠物，而椅子和床则是家具，而且猫和床往往比狗更容易区分。这个属性表明可以用分层的方式进行分类，而不是把所有的类都安排在一个“平面”结构中。在进行层次分类时，分类器首先知道苹果应该在水果的粗类别中，然后可以在更精细的级别上将其分类为苹果。分层分类的一个好处是，错误可以限制在一个子类别，这也意味着它应该比平面分类提供更多的信息。例如，分类器可能会将苹果与橙子混淆，但知道它至少应该是水果，因此不会将其与红色斯诺克球混淆。

2.介绍

卷积神经网络(CNN)图像分类器传统上设计为具有单个输出层的顺序卷积层。这是基于一个假设，即所有目标阶层都应该得到平等和排他性的对待。然而，有些类可能比其他类更难区分，并且类可能被组织在类别的层次结构中。同时，CNN被设计为学习基于其分层结构从输入数据中抽象出来的内部表示。因此，很自然地要问，是否可以将这个想法的逆应用于学习一个模型，该模型可以使用多个输出层按类抽象的降序进行分类层次的预测。在本文中，我们引入了传统CNN模型的一种变体，称为分支卷积神经网络(Branch Convolutional Neural Network, B-CNN)。B-CNN模型沿着与目标类的层次结构相对应的串联卷积层输出从粗到细的多个预测，这可以看作是对输出的先验知识的一种形式。引入了分支训练策略(BT-strategy)，该策略平衡了先验的严格性和在输出层上调整参数的自由，使损失最小化。通过这种方式，我们证明了基于CNN的模型可以在输出阶段强制学习内层中从粗到精的概念，并且可以采用分层先验知识来提高CNN模型的分类性能。

CNN的较低层通常捕获图像的低级特征，如基本形状，而较高层则可能提取高级特征，如狗的脸。因此，将类的层次结构嵌入CNN模型的一种可能方法是，随着数据的流动，沿着CN