社交网络人员推荐与普适计算知识结构可视化研究
在当今数字化时代,社交网络中的人员推荐以及普适计算领域的知识结构研究变得至关重要。人员推荐能够帮助用户在社交网络中找到更合适的交流对象,而普适计算知识结构的可视化则有助于科研人员更好地把握该领域的研究方向和趋势。
1. 基于聚合双向意图的人员推荐
1.1 评估指标
在人员推荐研究中,有几个关键的评估指标:
-
成功率(Success Rate)
:预测成功联系的比例,计算公式为 (Suc = ns(K, +)/ns(K)),其中 (ns(K)) 是 (K) 的交互次数,(ns(K, +)) 是 (K) 的正向交互次数。
-
规则使用率(Rule Usage)
:每条规则的用户数量,即 (Usage = n(N)/n(R)),其中 (n(N)) 是给定方法覆盖的用户数量,(n(R)) 是该方法生成的规则数量。
-
条件复杂度(Condition Complexity)
:每条规则的条件元素数量,计算公式为 (Complexity = n(C)/n(R)),其中 (n(C)) 是给定方法所有规则的条件元素数量,(n(R)) 是该方法的规则数量。
1.2 覆盖率结果
| 发送者类型 | CF(覆盖率) | 规则(覆盖率) |
|---|---|---|
| 零接收 | 3,431 (45.4%) | 7,560 (100.0%) |
| 少量接收 | 6,572 (77.3%) | 8,507 (100.0%) |
| 平均 | 9,725 (86.7%) | 11,223 (100.0%) |
| 热门 | 2,767 (89.2%) | 3,097 (100.0%) |
| 所有用户 | 22,495 (74.0%) | 30,387 (100.0%) |
从表中可以看出,CF 方法在测试期间平均能为 74.0% 的发送者提供推荐,对于近期交互多的发送者推荐较多,而对于零接收的发送者推荐较少,仅为 45.4%。而新方法能够为测试期间的所有发送者生成推荐。
1.3 成功率结果
| 发送者类型 | 测试 | CF | 规则(不同 (ω_r) 权重) |
|---|---|---|---|
| 0.00 | |||
| 零接收 | 14.1% | 11.0% | 18.1% |
| 少量接收 | 14.0% | 13.8% | 20.2% |
| 平均 | 18.2% | 19.3% | 23.6% |
| 热门 | 24.8% | 25.8% | 30.8% |
| 所有用户 | 16.7% | 17.3% | 21.5% |
测试期间的整体基线成功率为 16.7%,热门发送者的基线成功率最高,为 24.8%。CF 方法的成功率(17.3%)略高于测试基线成功率,而新方法对于所有类型的用户都给出了更高的成功率(21.5% - 22.6%)。这是因为 CF 方法仅反映“发送者的兴趣”,而新方法同时反映了“发送者的兴趣”和“接收者对发送者的兴趣”。随着权重从 0.00 增加到 0.75,成功率有所增加,但增幅不显著。
1.4 规则获取结果
| 发送者类型 | 规则(不同 (ω_r) 权重) |
|---|---|
| 0.00 | |
| 零接收 | 3,470 |
| 少量接收 | 3,705 |
| 平均 | 4,617 |
| 热门 | 1,767 |
| 所有用户 | 8,910 |
新方法为每个用户生成规则以产生最合适的推荐,但由于不同发送者可能生成相同规则,实际创建的规则数量远少于发送者数量。从数据来看,热门发送者和零接收发送者每条规则的用户较少,可能是因为他们的规则更复杂,但数据并未显示他们的规则使用更多条件。
1.5 不同权重下的规则示例
以用户 1074 为例,不同权重下生成的规则不同:
| 发送者属性值 | 规则(不同权重) |
| — | — |
| 性别 = 男
年龄 = 40 - 44
职业 = 房地产
位置 = 阿德莱德
有时家中有孩子 | (ω_r = 0):性别 = 女 AND 位置 = 阿德莱德 AND 职业 = 医疗保健 / 医学
(ω_r = 0.25) 或 0.5:性别 = 女 AND 家中有孩子 AND 职业 = 医疗保健 / 医学 AND 位置 = 阿德莱德
(ω_r = 0.75):性别 = 女 AND 家中有孩子 AND 职业 = 医疗保健 / 医学 AND 年龄 = 40 - 44 |
当权重为 0 时,方法只考虑发送者的兴趣,忽略接收者对发送者的兴趣,属性选择偏向发送者兴趣值高的;当权重为 0.75 时,更注重接收者对发送者的兴趣值。
2. 普适计算知识结构可视化
2.1 研究背景
普适计算是一个快速发展的研究领域,由于科研出版物数量巨大,即使在自己的专业领域也难以揭示科学知识的增长。因此,为科学家提供知识可视化工具,以发现科学范式的存在和其运动是一项具有挑战性的任务。
2.2 知识可视化技术
信息可视化技术在过去十年中迅速发展,以下是一些相关技术:
-
向量空间模型
:在信息检索中,用于基于词频对文档进行索引。
-
贝叶斯定理
:现代统计概率建模的核心部分,关注多个变量之间的概率关系。
-
香农信息理论
:描述信息在通信中可被量化。
-
自组织特征映射
:通过神经网络进行分类过程,如 Lin 等人首次将自组织映射用于信息检索可视化,WEBSOM 基于自组织映射组织文本文件以进行探索和搜索。
2.3 知识结构可视化方法
- 引文索引 :自 1950 年代以来广泛应用,科学映射的基本目标之一是识别研究领域的趋势,通过引文分析创建的地图提供了逐年的文献历史数据,显示了学科领域之间的内在语义联系。
- 作者共引分析(ACA) :用于发现特定学科领域的科学家在科学出版物中如何在智力上相互关联,该领域杰出作者的知识结构为知识可视化提供了可靠来源。
- 知识领域可视化(KDV) :描绘科学领域的结构和演变,一些知识发现和数据挖掘系统包括工程领域的分析。
2.4 因子分析
因子分析是作者共引分析中常用的方法,用于识别给定共引数据在学科领域中的内在维度。当数据集较大时,作者共引矩阵可能很大,分析变得复杂和昂贵。White 和 McCain 提出将原始共引转换为皮尔逊相关系数,相关系数衡量作者共引轮廓之间的接近程度,主成分分析(PCA)是提取因子的建议替代方法,通常选择特征值大于 1 作为提取因子数量的默认标准,缺失数据用相应作者的平均共引计数替换,皮尔逊相关系数可作为作者对之间相似度的度量。
2.5 路径查找网络缩放
路径查找网络缩放最初由认知心理学家开发用于结构建模,它依赖三角形不等式条件从接近度数据中选择最显著的关系。路径查找网络(PFNET)由原始图的所有顶点组成,边的数量由语义的基本结构决定,其拓扑由两个参数 (q) 和 (r) 决定,相应的网络表示为 PFNET ((q), (r)),(q) 参数控制三角形不等式条件的范围,(r) 参数用于计算路径的距离,路径权重计算公式为 ((\sum_{i = 1}^{k} w_i^r)^{\frac{1}{r}})。
2.6 普适计算知识结构分析流程
graph LR
A[数据收集:在线引文数据库 CiteSeer 和 Web of Science] --> B[计算皮尔逊相关系数]
B --> C[PFNET 缩放]
C --> D[生成普适计算知识结构地图]
D --> E[识别主要研究主题和相互关系]
通过以上流程,可以揭示普适计算的知识结构,主要研究主题和相互关系可以通过知识结构地图轻松识别,这对于刚进入该领域的研究人员非常有帮助。
3. 人员推荐方法总结与分析
3.1 不同方法的优势对比
我们对 CF 方法和新方法在人员推荐方面的表现进行了综合对比,如下表所示:
| 方法 | 覆盖率 | 成功率 | 规则特点 |
| — | — | — | — |
| CF 方法 | 平均为 74.0% 的发送者提供推荐,对零接收发送者推荐少 | 成功率略高于基线,不同类型用户表现差异不大 | 未明确体现规则相关特点 |
| 新方法 | 能为所有发送者生成推荐 | 对所有类型用户成功率更高,最高可达 36% 高于基线 | 为每个用户生成规则,热门和零接收发送者规则可能更复杂 |
从表格中可以清晰看出,新方法在覆盖率和成功率上都具有明显优势。CF 方法虽然在一定程度上能提供推荐,但对于零接收发送者的覆盖不足,而新方法弥补了这一缺陷。在成功率方面,新方法考虑了发送者和接收者的双向兴趣,使得推荐更加精准。
3.2 权重对推荐规则的影响
不同权重下的规则生成会受到发送者和接收者兴趣的影响,具体表现如下:
-
权重为 0 时
:只考虑发送者的兴趣,忽略接收者对发送者的兴趣,属性选择偏向发送者兴趣值高的。例如用户 1074 在 (ω_r = 0) 时,选择位置为阿德莱德是因为其“发送者兴趣”值高。
-
权重为 0.75 时
:更注重接收者对发送者的兴趣值,属性选择会根据接收者的反馈进行调整。如用户 1074 在 (ω_r = 0.75) 时,位置属性的选择发生了变化。
这种权重的变化影响了规则的生成,从而使得推荐更加符合实际情况,提高了推荐的成功率。
3.3 人员推荐的整体流程
graph LR
A[确定发送者类型] --> B[选择推荐方法(CF 或新方法)]
B --> C[根据权重生成规则]
C --> D[生成推荐列表]
D --> E[评估推荐成功率]
E --> F{成功率是否满意}
F -- 是 --> G[结束推荐流程]
F -- 否 --> B[重新选择方法或调整权重]
该流程图展示了人员推荐的整体流程,从确定发送者类型开始,选择合适的推荐方法,根据权重生成规则,进而生成推荐列表。通过评估推荐成功率,判断是否需要重新选择方法或调整权重,最终达到满意的推荐效果。
4. 普适计算知识结构可视化的深入探讨
4.1 因子分析和路径查找网络缩放的协同作用
因子分析和路径查找网络缩放是普适计算知识结构可视化的重要方法,它们的协同作用如下:
-
因子分析
:用于识别给定共引数据在学科领域中的内在维度,将原始共引转换为皮尔逊相关系数,衡量作者共引轮廓之间的接近程度。
-
路径查找网络缩放
:依赖三角形不等式条件从接近度数据中选择最显著的关系,由两个参数 (q) 和 (r) 决定网络拓扑。
两者结合,先通过因子分析处理数据,得到相关系数,再利用路径查找网络缩放进行结构建模,从而揭示普适计算的知识结构。
4.2 知识结构可视化的实际应用
知识结构可视化在普适计算领域有很多实际应用,例如:
-
研究方向指引
:对于新进入该领域的研究人员,通过知识结构地图可以快速了解主要研究主题和相互关系,确定自己的研究方向。
-
学术合作推荐
:根据作者共引分析和知识结构可视化,可以发现不同研究人员之间的智力关联,为学术合作提供推荐。
-
领域趋势分析
:通过对历年文献的分析,观察知识结构的演变,识别普适计算领域的发展趋势。
4.3 普适计算知识结构可视化的未来挑战
虽然普适计算知识结构可视化取得了一定的成果,但仍面临一些未来挑战:
-
数据处理能力
:随着科研出版物数量的不断增加,数据量越来越大,如何高效处理和分析这些数据是一个挑战。
-
可视化效果优化
:如何将复杂的知识结构以更加直观、清晰的方式呈现给用户,提高可视化效果,是需要进一步研究的问题。
-
动态变化跟踪
:普适计算领域发展迅速,知识结构不断变化,如何实时跟踪和反映这些动态变化是一个难题。
5. 总结与展望
5.1 人员推荐和知识结构可视化的总结
人员推荐方面,新方法通过结合发送者和接收者的双向兴趣,在覆盖率和成功率上都优于 CF 方法。不同权重的设置影响了推荐规则的生成,使得推荐更加精准。普适计算知识结构可视化方面,利用因子分析和路径查找网络缩放等方法,能够揭示该领域的主要研究主题和相互关系,为研究人员提供了有价值的信息。
5.2 未来研究方向
- 人员推荐 :未来计划研究发送者的活动如何受到推荐的影响,特别是用户对不同权重值生成的推荐的响应。同时,将探索替代规则生成方法,如放松规则条件,利用领域知识选择或拒绝某些属性,对推荐进行排名等。
- 普适计算知识结构可视化 :将进一步优化数据处理能力,提高可视化效果,实时跟踪知识结构的动态变化。还可以结合更多的数据源和技术,如社交媒体数据、机器学习算法等,深入挖掘普适计算领域的知识。
通过对人员推荐和普适计算知识结构可视化的研究,我们可以更好地利用信息技术,为社交网络和科研领域提供更有价值的服务和支持,推动相关领域的发展。
超级会员免费看
1835

被折叠的 条评论
为什么被折叠?



