CyberIR:打击网络犯罪的技术新途径
1. 相关研究与术语出现情况
在信息检索领域,有诸多研究致力于提升检索效果。Kim等人的研究通过模糊推理,利用共现相似度、反馈文档内的文档频率和逆文档频率等信息计算相关性程度,并以此对术语进行重新加权。Okabe等人提出了一种通过相关反馈学习过滤规则集来优化文档排名的方法,Azimi - Sadjadi则引入了一种利用多个专家用户的相关反馈对原始查询进行最优映射的学习机制。
本研究识别了检索文档中术语出现情况(Term Appearance Situations,简称tas)的信息,用于提升检索效果。术语出现情况分为以下三种:
- tas 1 :术语仅出现在相关文档中,不出现在不相关文档中。
- tas 2 :术语仅出现在不相关文档中,不出现在相关文档中。
- tas 3 :术语既出现在相关文档中,也出现在不相关文档中。
由于相关和不相关反馈对提升信息检索都有帮助,因此属于tas 1、2、3的术语都可应用于提升检索效果,但应用方式不同。后续系统设计将基于tas信息制定向量加权策略。
2. CyberIR系统框架
为解决跨国获取法律、组织和技术事务信息的难题,开发了信息检索系统CyberIR。其系统框架如下:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(U
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



