语义信息检索与数据挖掘隐私保护技术
在当今信息爆炸的时代,信息检索和数据挖掘变得至关重要。一方面,有效的信息检索能够帮助用户快速准确地获取所需信息;另一方面,数据挖掘在处理大量数据时,也面临着隐私保护的挑战。本文将介绍两种相关技术:基于本体的自动查询扩展技术用于语义信息检索,以及基于中国剩余定理(CRT)的数据挖掘隐私保护技术。
基于本体的自动查询扩展技术
在语义信息检索中,为了提高查询结果的相关性,自动查询扩展是一种常用的技术。
概念语义相似度计算
概念之间的语义相似度是查询扩展的基础。概念 ( c_1 ) 和 ( c_2 ) 之间的语义相似度 ( SSim(c_1, c_2) ) 定义如下:
[
SSim(c_1, c_2) =
\begin{cases}
0 & \text{if } dist(c_1, c_2) = \infty \
SSm & \text{otherwise} \
1 & \text{if } dist(c_1, c_2) = 0 \text{ or } c_1 = c_2
\end{cases}
]
其中,
[
SSm = p * \frac{1}{1 + a * dist(c_1, c_2)} + q * \frac{1}{|L(c_1) - L(c_2)| + 1} + r * \frac{|compc(c_1, c_2)|}{|upc(c_1, c_2)|}
]
并且 ( p + q + r = 1 )。
查询扩展算法
该算法的
超级会员免费看
订阅专栏 解锁全文
1011

被折叠的 条评论
为什么被折叠?



