
information retrieval
JasonDecode
这个作者很懒,什么都没留下…
展开
-
intersection more than 3 lists of documents
def Intersection(p1, p2): answer = [] i = j = 0 while i < len(p1) and j < len(p2): if p1[i] == p2[j]: answer.append(p1[i]) i += 1 j += 1 elif p1[i] > p2[j]: j += 1原创 2020-10-07 20:48:08 · 82 阅读 · 0 评论 -
union of 2 inverted list
merge of 2 inverted list def Merge(p1, p2): answer = [] i = j = 0 while i < len(L1) or j < len(L2): if p1[i] == p2[j]: answer.append(p1[i]) i += 1 j += 1 elif p1[i] > p2[j]:原创 2020-10-07 20:47:35 · 81 阅读 · 0 评论 -
intersection/merge of 2 inverted list
算法: 代码: L1 = [13, 57, 61, 114, 987, 1000] L2 = [5, 23, 57, 63, 114, 257, 1000] L = [] i = j = 0 while i < len(L1) and j < len(L2): if L1[i] == L2[j]: L.append(L1[i]) i += 1 j += 1 elif L1[i] > L2[j]: j += 1原创 2020-10-07 20:46:05 · 79 阅读 · 0 评论 -
information retrieval-信息检索-布尔模型和inverted index
如何从莎士比亚的作品中找出包含Brutus 和 Caesar 不包括 Calpurnia 的作品。也许会读其每一部作品, 或扫描每部作品, 这需要大量时间。如果用以下布尔模型, 会加快检索速度. 取横向量, 再进行bitwise运算。 Brutus AND Caesar AND NOT Calpurnia 110100 AND 110111 AND 101111 = 100100 这样可以极快的得到结果, 第一部和第四部作品满足条件。 Antony and Cleopatra and Hamlet 以上.原创 2020-09-11 11:07:25 · 294 阅读 · 0 评论