利用标签和图像描述位置:社交图像媒体的位置分析与交互探索
在当今的社交图像媒体中,如何为一组给定的图像生成具有代表性的标签是一个重要的研究课题。本文将介绍一种基于位置的标签挖掘方法,以及如何通过交互式探索来发现特定区域的标签。
1. 基于位置的标签挖掘
1.1 模式挖掘背景
在大型数据集中,标签数量通常非常庞大。为了为用户提供有针对性的有趣候选标签,我们采用了模式挖掘中的子组发现方法。子组发现旨在根据特定的兴趣度度量,识别与给定目标属性相关的有趣模式。在我们的应用中,目标属性是通过用户提供的位置(如特定兴趣点、地标或区域)构建的。
形式上,数据库 $D = (I, A)$ 由一组个体 $I$(图片)和一组属性 $A$(标签)组成。选择器或基本模式 $sel_{a=aj}$ 是一个布尔函数 $I \to {0, 1}$,当且仅当个体的属性 $a$ 的值为 $aj$ 时为真。复杂模式或子组描述 $sd = {sel_1, \ldots, seld}$ 由一组基本模式组成,解释为合取。子组(扩展)$sg$ 是由子组描述 $sd$ 覆盖的个体集合。
子组发现任务可以由一个五元组 $(D, T, S, Q, k)$ 指定:
- 目标概念 $T: I \to R$ :指定感兴趣的属性,它将数据集中的每个实例映射到一个目标值 $t$,可以是二进制或任意目标值。
- 搜索空间 $2^S$ :由一组基本模式 $S$ 定义。
- 质量函数 $Q: 2^S \to R$ :将搜索空间中的每个模式映射到一个实数,反映模