0. 备注:
搜索引擎标签指的是我之前在网上找解决方案时用的查询关键字,但是搜索结果并不是我想要的。- Lucene 版本 8.2.0 (org.apache.lucene.util.Version#LATEST=LUCENE_8_2_0)
1. 用于删除的键需要是可索引的
搜索引擎标签:
- Lucene 删除之后还能查询到
private void write(IndexWriter indexWriter) throws Exception
{
Document doc = new Document();
// doc.add(new StoredField("id", "123456789")); // WRONG
// doc.add(new Field("id", new BytesRef("123456789"), StringField.TYPE_STORED)); // YES
doc.add(new TextField("id", "123456789", Field.Store.YES)); // YES
doc.add(new TextField("summary", "HelloWorld", Field.Store.YES));
doc.add(new TextField("title", "China No.1", Field.Store.YES));
doc.add(new StoredField("content", "This is content"));
indexWriter.addDocument(doc);
indexWriter.commit();
}
在最初,我用的 id 字段就是 StoredField 类型。
调用 public long deleteDocuments(Term... terms) 能得到一个不为0的返回结果,但是并没有成功删除,因为还能查询到。
参考链接: delete documents based on storedfield.
2. 数组类型字段的值要查询的话,参数需要是 TextField
搜索引擎标签:
- Lucene 多 Field 查询不到
private void write(IndexWriter indexWriter) throws Exception
{
Document doc = new Document();
doc.add(new TextField("id", "123456789", Field.Store.YES));
doc.add(new TextField("summary", "HelloWorld", Field.Store.YES));
doc.add(new TextField("title", "China No.1", Field.Store.YES));
doc.add(new StoredField("content", "This is content"));
String[] keywords = new String[]{"Java", "C++", "Python"};
for(String keyword : keywords) {
// doc.add(new StringField("keywords", keyword, Field.Store.NO)); // Not Found
doc.add(new TextField("keywords", keyword, Field.Store.NO));
}
indexWriter.addDocument(doc);
indexWriter.commit();
}
我存储多个 keyword 为 keywords, 如果我keyword将存储成 StringField 的话是查询不到的,需要存储为 TextField。
即使我不想单个 keyword 被分词,但是现在我不知道怎么处理。
本文探讨了在使用Lucene 8.2.0进行文档删除及查询时遇到的问题,指出删除操作需确保键可索引,特别是对于StoredField类型的字段,以及查询多字段时,关键词字段应设置为TextField类型,以确保正确检索。
522

被折叠的 条评论
为什么被折叠?



