基于接近性的移动社交网络信任推断
在移动社交网络中,信任的评估和建立是一个重要的问题。本文将介绍一种基于接近性的信任推断方法,通过分析用户之间的接近性数据来推断信任关系。
1. 信任与接近性
接近性与真实社交关系之间存在着紧密的关联。接近性可以被视为信任关系的结果,同时,用户之间接近的时间越长,他们成为朋友的概率就越高。接近性可以分为物理接近性和虚拟接近性。物理接近性可以通过蓝牙、Wi-Fi 等技术检测,而虚拟接近性则可以通过监测社交活动(如聊天、短信、语音通话、在 Facebook 上点赞等)来实现。
为了综合不同类型的接近性并考虑它们之间的价值差异,我们定义了一种接近性数据类型 η,它是一个元组:
η = < p, l, t, ds, dd, s, m >,其中:
- 接近性类型 (p) :分为虚拟和物理两种模式,有助于区分面对面互动和虚拟接近性。
- 位置 (l) :指接近性发生的物理空间位置,其含义可以从社会语义方面进行扩展,例如家庭环境中的接近性通常更具亲密性。
- 时间 (t) :是接近性发生时刻的时间测量,时间的定义也可以在语义上进行扩展,例如周末和工作时间的接近性具有不同的社会价值。
- 源设备类型 (ds) :考虑设备的移动性等特性,例如智能手机等移动设备的接近性数据更可靠,因为人们通常会随身携带。
- 目标设备类型 (dd) :是被观察用户的设备类型。
- 传感方法 (s) :考虑技术对测量方法的影响,例如蓝牙检测的接近性范围比 Wi-Fi 短,但更可靠,因为它能捕捉到更近的用户。
- 测量类型 (m) :区分接近性的持续时间和频率,为此引入了接近性系数,用于组合不同类型的接近性。
接近性数据类型使我们能够考虑不同接近性之间的价值差异,并为每个接近性数据分配一个系数。可以使用模糊逻辑等技术来确定这些系数,然后通过加权平均的方法将多个接近性数据源进行组合。
下面是三种不同接近性数据类型的示例表格:
| η | p | l | t | ds | dd | s | m |
| — | — | — | — | — | — | — | — |
| η1 | physical | anywhere | anytime | mobile | mobile | bluetooth | duration |
| η2 | physical | office | working time | mobile | laptop | WiFi | duration |
| η3 | virtual | anywhere | night | mobile | mobile | SMS | frequency |
我们还定义了接近性记录:ProximityRecord = < UserID, η, Value >,其中 UserID 是被观察用户的唯一标识符,η 是观察到的接近性的数据类型,Value 是观察到的接近性值,根据数据类型可以是持续时间或频率。每个用户的设备都有一组接近性元组,称为观察集。以下是用户 A 设备提供的接近性持续时间数据示例:
| UserID | η | Value |
| — | — | — |
| B | η1 | 200h |
| C | η1 | 20h |
| D | η1 | 80h |
| E | η1 | 30h |
| F | η1 | 0.5h |
2. 基于接近性的信任初始化
基于接近性的信任初始化是在节点之间建立一对一的信任关系。将各种接近性数据转换为有意义的信任值范围是信任计算中最具挑战性的部分。我们使用标准分数公式将接近性记录转换为基于接近性的信任值。
2.1 定义
- 标准分数 :标准分数表示一个观察值或数据点相对于平均值的标准差数量。公式为:
[Z = \frac{datum - mean}{standard\ deviation} = \frac{x - \mu}{\sigma}]
使用标准分数的好处是,每个节点可以根据自己与其他用户的平均接近性持续时间来归一化信任值,从而使每个信任值无偏且有界,消除了由于用户行为差异导致的接近性持续时间变化的影响。 - 观察集 (OS) :用户的观察集包括所有被检测到与该用户接近的用户。
- 接近性窗口函数 :$P_w^{\eta_i}(A, B)$ 表示在时间窗口 w 内,用户 A 监测到的用户 B 具有接近性数据类型 $\eta_i$ 的累积接近性。
- 基于接近性的信任函数 :
[T_t^{\eta_i}(A, B) =
\begin{cases}
-\infty & \text{if } (B \notin OS_A) \
\frac{P_w^{\eta_i}(A, B) - \mu_w^{\eta_i}}{\sigma_w^{\eta_i}} & \text{if } (B \in OS_A \land t \leq w) \
(1 - \alpha) * T_p^{\eta_i}(A, B) + \alpha * \frac{P_w^{\eta_i}(A, B) - \mu_w^{\eta_i}}{\sigma_w^{\eta_i}} & \text{if } (B \in OS_A \land t > w)
\end{cases}]
其中: - $T_t^{\eta_i}(A, B)$ 是用户 A 在时刻 t 针对用户 B 具有接近性数据类型 $\eta_i$ 的基于接近性的信任值。
- $T_p^{\eta_i}(A, B)$ 是用户 A 在时刻 p = t - t % w 针对用户 B 具有接近性数据类型 $\eta_i$ 的过去获得的基于接近性的信任值。
- $P_w^{\eta_i}(A, B)$ 是在给定时间段 w 内,用户 B 具有接近性数据类型 $\eta_i$ 的累积接近性。
- $\alpha$ 是一个系数,范围在 ]0, 1[ 之间,定义了新观察到的接近性对最近一次基于接近性的信任值计算的影响程度。
- $\mu_w^{\eta_i}$ 和 $\sigma_w^{\eta_i}$ 分别是在时间窗口 w 内具有接近性数据类型 $\eta_i$ 的观察期平均值和标准差。
- 基于接近性的信任聚合函数 :用于组合从不同接近性数据类型推断出的信任值。
[T_t(A, B) =
\begin{cases}
-\infty & \text{if } (B \notin OS_A) \
\frac{\sum_{i = 1}^{|K_A^B|} k_{\eta_i} * T_t^{\eta_i}(A, B)}{\sum_{i = 1}^{|K_A^B|} k_{\eta_i}} & \text{if } (B \in OS_A)
\end{cases}]
其中 $T_t^{\eta_i}$ 和 $k_{\eta_i}$ 分别是接近性类型 $\eta_i$ 的信任值和系数,$K_A^B$ 是用户 A 和 B 之间所有观察到的接近性类型的系数集合。
2.2 语义信任推断
根据计算得到的信任值 $T_t$,我们可以推断用户之间的信任关系。将信任尺度平均分为四个部分,定义了四个信任级别:未知信任、轻度信任、中度信任和高度信任。
- 未知信任 :信任值 $T_t$ 评估在区间 ] -∞, -0.67[ 内的人员,系统认为此类人员的信任信息不足。
- 轻度信任 :信任值在 [-0.67, 0[ 范围内的人员。
- 中度信任 :信任值在 [0, 0.67[ 范围内的人员。
- 高度信任 :信任值在 [0.67, +∞[ 范围内的人员。
如果推断出的基于接近性的信任值高于 -0.67,则认为建立了基于接近性的信任关系。正式定义为:如果 $T(A, B) \geq -0.67$,则表示用户 A 和 B 之间的信任关系成立,记为 $A \stackrel{T}{\rightarrow} B$。
例如,用户 A 的移动设备记录了与其他用户的接近性数据,其观察集 $OS_A = {B, C, D, E, F}$。假设在无限时间窗口(w = +∞)下,对于 $\eta_1$ 接近性数据类型,$P_w^{\eta_1}(A, B) = 200h$,接近性持续时间的平均值 $\mu_w^{\eta_1} = 66.1$。计算标准差时,先计算每个数据点与平均值的差值并平方,然后将这些值的总和除以数据点数量并取平方根,得到 $\sigma_w^{\eta_1} = 71.90$。使用公式计算用户 B 的基于接近性的信任值为 $T_t^{\eta_i}(A, B) = \frac{200 - 66.1}{71.90} = 1.86$,由于该值大于 0.67,所以用户 A 高度信任用户 B,即 $A \stackrel{T}{\rightarrow} B$。
通过以上方法,我们可以利用接近性数据来初始化和推断移动社交网络中的信任关系。这种方法考虑了多种接近性因素,并通过标准化和聚合的方式将不同类型的接近性数据转换为有意义的信任值,为移动社交网络中的信任评估提供了一种有效的途径。
下面是这个过程的 mermaid 流程图:
graph LR
A[收集接近性数据] --> B[定义接近性数据类型]
B --> C[分配接近性系数]
C --> D[计算基于接近性的信任值]
D --> E[语义信任推断]
E --> F[建立信任关系]
在后续部分,我们将通过实验评估这种方法的有效性,具体内容将在下文继续介绍。
基于接近性的移动社交网络信任推断
3. 实验评估
为了验证基于接近性的信任推断方法的有效性,我们需要一个大规模的接近性数据集,该数据集应包含不同类型的数据,以便能够组合不同类型的观察接近性得到的信任值。同时,多跳信任估计需要大量的用户数据,并且还需要对观察用户之间的信任和其他社会事实(如友谊)进行调查,以便将推断的信任值与真实的社会事实进行比较。
目前,我们使用了现实挖掘数据集,这是唯一公开可用的包含移动电话接近性记录和自我报告调查数据的数据集。该项目由麻省理工学院媒体实验室在 2004 - 2005 年期间开展,使用 100 部诺基亚 6600 手机和上下文记录软件,收集了 330,000 小时的连续行为数据,并对用户进行了关于友谊和计划见面对象的调查。
我们的实验目的是回答以下问题:引导的信任值与真实社会事实(如友谊)的相关程度如何?
实验步骤如下:
1. 计算用户之间基于接近性的信任值。
2. 将每个用户计算得到的基于接近性的信任值与他们在调查中给出的答案进行比较,验证推断的信任值是否与友谊一致。
通过现实挖掘数据集,我们可以计算出两人之间由蓝牙检测到的接近性持续时间。将基于接近性的信任函数应用于这些接近性持续时间,得到每个用户的基于接近性的信任值 $T_t(A, B)$。从调查中,我们可以了解到每个用户预测与朋友的未来接近性,以及是否会在实验室内外与其他人见面。这些信息表明,被提及的人要么是朋友,要么从用户的角度来看是重要的人,因此可以推测这些用户之间可能存在信任关系。
以下是调查中报告人群的平均信任值表格:
| 组 | 最小信任平均值 | 信任值平均值 |
| — | — | — |
| 朋友 | 1.4070 | 2.0209 |
| inLab | -0.3079 | 0.7696 |
| outLab | 0.0068 | 1.0460 |
从表格中可以看出,朋友组的平均信任值最高,根据之前定义的信任级别,朋友被归类为高度信任。inLab 组(用户在麻省理工学院实验室内遇到的人)的信任值总体位于轻度信任和中度信任分类中。outLab 组(通常包括朋友、家人和朋友的朋友,用户在工作区域外遇到的人)的信任值接近高度信任组的边界。
此外,我们还计算了用户之间的相似度,用于信任传递性计算。以下是调查中报告人群的平均相似度表格:
| 组 | 最小相似度平均值 | 相似度平均值 |
| — | — | — |
| 朋友 | 0.2913 | 0.4828 |
| inLab | -0.0858 | 0.2520 |
| outLab | 0.0089 | 0.3372 |
可以看出,相似度值的变化与基于接近性的信任值非常相似,并且随着关系的特征而变化。这表明相似度是信任的一种度量,也证明了朋友在关系上相似且相互推荐的社会事实。
下面是不同组用户信任值在语义分类中的百分比分布表格:
| 组 | 轻度信任 | 中度信任 | 高度信任 |
| — | — | — | — |
| 朋友 | 31.51% | 36.15% | 32.34% |
| inLab | 25.35% | 46.18% | 28.46% |
| outLab | 36.52% | 35.39% | 28.09% |
从这个表格中,我们可以更直观地看到不同组用户信任值的分布情况。
以下是实验评估过程的 mermaid 流程图:
graph LR
A[选择数据集] --> B[计算信任值]
B --> C[与调查答案比较]
C --> D[分析信任值与友谊的一致性]
D --> E[得出实验结论]
4. 总结与展望
通过上述研究,我们提出了一种基于接近性的移动社交网络信任推断方法。该方法通过定义接近性数据类型、分配系数、计算信任值和进行语义信任推断,能够有效地利用接近性数据来初始化和推断用户之间的信任关系。
实验评估结果表明,推断的信任值与真实社会事实(如友谊)具有较高的相关性。朋友组的信任值和相似度均高于其他组,这表明该方法能够捕捉到社交关系的强度。
未来,我们可以进一步优化该方法,例如考虑更多的接近性因素、改进系数计算方法等,以提高信任推断的准确性。同时,可以将该方法应用于更多的移动社交场景,如推荐系统、安全认证等,为移动社交网络的发展提供更有力的支持。
综上所述,基于接近性的信任推断方法为移动社交网络中的信任评估提供了一种可行的解决方案,具有一定的理论和实践价值。
超级会员免费看

913

被折叠的 条评论
为什么被折叠?



