我需要一种方法来折叠重复项(根据具有ID的字符串字段定义),从而导致solr。我知道这种功能将在下一个版本(1.5)中推出,但我等不及了。使用当前的稳定版本1.4删除重复项的最佳方法是什么?

鉴于在我的情况下查找重复项确实很容易(与字符串字段进行比较),应该将其作为过滤器,还是应该覆盖现有的SearchComponent或编写新的Component,还是使用诸如胡萝卜2这样的外部库?

总体结果计数应反射(reflect)缩短的结果。

最佳答案

嗯,有一个解决方案:只需应用折叠字段补丁即可(有关此功能的最新消息,请参见http://issues.apache.org/jira/browse/SOLR-236,我也建议您http://blog.jteam.nl/author/martijn)。

这样做,您将可以使用CollapseComponent。请注意,与此功能相关的搜索性能下降。

10-08 02:35