我正在使用Elasticsearch 5.5.2

我正在尝试词组建议程序,但无法对其进行配置以返回已经在索引中的确切建议。我的索引设置,类型映射和短语建议查询如下。请帮忙。

我的索引设置和类型映射是

PUT test
{
  "settings": {
    "index": {
      "analysis": {
        "analyzer": {
          "trigram_analyzer": {
            "type": "custom",
            "tokenizer": "standard",
            "filter": ["shingle"]
          }
        },
        "filter": {
          "shingle": {
            "type": "shingle",
            "min_shingle_size": 2,
            "max_shingle_size": 3
          }
        }
      }
    }
  },
  "mappings": {
    "test": {
      "properties": {
        "title": {
          "type": "text",
          "fields": {
            "trigram": {
              "type": "text",
              "analyzer": "trigram_analyzer"
            }
          }
        }
      }
    }
  }
}

索引文件使用
POST test/test?refresh=true
{"title": "noble prize"}

我正在使用的短语建议者
POST test/_search
{
  "suggest": {
    "text": "nobe priz",
    "simple_phrase": {
      "phrase": {
        "field": "title.trigram",
        "size": 1,
        "gram_size": 3,
        "direct_generator": [ {
          "field": "title.trigram",
          "suggest_mode": "always"
        } ],
        "highlight": {
          "pre_tag": "<em>",
          "post_tag": "</em>"
        }
      }
    }
  }
}

我得到的结果是
"suggest": {
    "simple_phrase": [
      {
        "text": "nobe priz",
        "offset": 0,
        "length": 9,
        "options": [
          {
            "text": "noble priz",
            "highlighted": "<em>noble</em> priz",
            "score": 0.09049256
          }
        ]
      }
    ]
  }

我的问题是,对于搜索文字-“nobe priz”-为什么我没有获得“贵族奖”作为建议。取而代之的是为什么我只得到“高贵的priz”?

如果看到的话,“高贵奖品”就是我保存的文件。

而且,如果我将size的值增加到“2”,那么我也不会获得“贵族奖”作为建议之一。

大小为2,对于搜索文本“nobe priz”,我得到以下响应
"suggest": {
    "simple_phrase": [
      {
        "text": "nobe priz",
        "offset": 0,
        "length": 9,
        "options": [
          {
            "text": "noble priz",
            "highlighted": "<em>nobel</em> priz",
            "score": 0.09049256
          },
          {
            "text": "nobe prize",
            "highlighted": "nobe <em>prize</em>",
            "score": 0.09049256
          }
        ]
      }
    ]
  }

我应该怎么做才能获得“贵族奖”作为建议?
请帮忙。

最佳答案

我自己找到了答案。需要使用参数“max_errors”告诉ES,搜索文本中有多少个单词拼写错误。 “max_errors”可以百分比形式给出,以float或绝对数字的形式给出。

“单击以下链接以获取具有max_errors参数的词组建议程序的ES文档”
https://www.elastic.co/guide/en/elasticsearch/reference/master/search-suggesters-phrase.html

因此,我将“max_errors”参数值添加为2,如下所示

POST test/_search
{
  "suggest": {
    "text": "nobe priz",
    "simple_phrase": {
      "phrase": {
        "field": "title.trigram",
        "size": 1,
        "gram_size": 3,
        "max_errors": 2,
        "direct_generator": [ {
          "field": "title.trigram",
          "suggest_mode": "always"
        } ],
        "highlight": {
          "pre_tag": "<em>",
          "post_tag": "</em>"
        }
      }
    }
  }
}

而且我得到了完全匹配的短语建议如下
"suggest": {
    "simple_phrase": [
      {
        "text": "nobe priz",
        "offset": 0,
        "length": 9,
        "options": [
          {
            "text": "noble prize",
            "highlighted": "<em>noble prize</em>",
            "score": 0.4833575
          }
        ]
      }
    ]
  }

因此,将max_errors设置为2时,建议“贵重物品”将返回。

干杯:)

关于elasticsearch - Elasticsearch,如何使词组提示返回准确建议?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46997796/

10-16 08:39