6、CyberIR:打击网络犯罪的技术新途径

CyberIR:打击网络犯罪的技术新途径

1. 相关研究与术语出现情况

在信息检索领域,有诸多研究致力于提升检索效果。Kim等人的研究通过模糊推理,利用共现相似度、反馈文档内的文档频率和逆文档频率等信息计算相关性程度,并以此对术语进行重新加权。Okabe等人提出了一种通过相关反馈学习过滤规则集来优化文档排名的方法,Azimi - Sadjadi则引入了一种利用多个专家用户的相关反馈对原始查询进行最优映射的学习机制。

本研究识别了检索文档中术语出现情况(Term Appearance Situations,简称tas)的信息,用于提升检索效果。术语出现情况分为以下三种:
- tas 1 :术语仅出现在相关文档中,不出现在不相关文档中。
- tas 2 :术语仅出现在不相关文档中,不出现在相关文档中。
- tas 3 :术语既出现在相关文档中,也出现在不相关文档中。

由于相关和不相关反馈对提升信息检索都有帮助,因此属于tas 1、2、3的术语都可应用于提升检索效果,但应用方式不同。后续系统设计将基于tas信息制定向量加权策略。

2. CyberIR系统框架

为解决跨国获取法律、组织和技术事务信息的难题,开发了信息检索系统CyberIR。其系统框架如下:

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(U
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值