Delete documentation using lucene 4 and retrieve all docIds of deleted docs

Delete documents using lucene 4 and retrieve all docIds of deleted docs

我正在使用 Lucene 4 来保存我的数据。我现在面临的问题如下:

如何从索引中删除文档,然后检索被删除文档的docIds?

这是我用来删除文档的方法:

Query query = new BooleanQuery();

...

indexWriter.deleteDocuments(query);

但是一旦调用了这个方法,我还没有找到一种方法(方法或回调)来获取已删除的文档(及其字段)。

有人知道怎么做吗?


我认为你不能一次通话。

由于 Lucene 删除不会立即发生(额外的 commit() 是必需的),返回已删除的文档 ID 会有点模棱两可。如果您查看 delete 方法,它实际上只是将作业添加到删除队列之一。也就是说,commit() 也不返回任何与此相关的内容;-(

无论如何,我能想到的唯一方法是运行您的 query,收集文档/文档 ID,然后运行 ??deleteDocuments(query)。您可能会遇到一些重叠(例如,如果另一个线程会删除相同的文档),但这是不可避免的,因为 commit() 阶段。


相关推荐

  • 检查Java中正则表达式中模式的第n次出现

    CheckfornthoccurrenceofpatterninregularexpressioninJava本问题已经有最佳答案,请猛点这里访问。我想使用Java正则表达式检查输入字符串中特定模式的第n次出现。你能建议怎么做吗?这应该可以工作:MatchResultfindNthOccurance(intn,Patternp,CharSequencesrc){Matcherm=p.matcher…
    2024-05-091
0.042374s