42、基于过往查询的概率性搜索结果复用与微博细粒度事件提取

基于过往查询的概率性搜索结果复用与微博细粒度事件提取

在信息检索和事件提取领域,有两项重要的研究值得关注,一项是关于利用过往查询进行信息检索的新算法,另一项是微博上细粒度事件提取的方法。

基于过往查询的信息检索算法

在信息检索中,为了提高检索的精度和效率,研究人员提出了一种新的基于过往查询的算法。

文档和查询的构建
  • 基本元素 :文档的最基本元素是词项,词项由英文字母组成。文档和查询都由词项构成,每个文档都是唯一的。
  • 词项选择 :由于构成文档的词项可能属于多个主题,因此使用Zipf定律或指数分布从不同主题中选择词项。
  • 查询构建 :过往查询从文档中创建,新查询则基于过往查询通过添加或删除词项来构建。
  • 相关性判断 :为了模拟用户对特定查询的文档相关性判断,应用了Bradford定律。
利用过往查询进行检索
  • 查询比较 :每个提交的查询都会与其相关文档一起保存。新查询会与系统中存储的过往查询进行比较,如果有相似的过往查询,则使用算法从最相似的过往查询中检索相关文档。
  • 文档分组 :算法将从过往查询中检索到的文档列表按2的幂次分组。例如,如果文档列表有30个文档,则将其近似为32个文档,并分为5组。
  • 相关性判断因素
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值