在 MySQL 中查询所有数据使用 SELECT * FROM table
,在 Elasticsearch 中我们使用 GET 索引/_search
来查询所有数据。响应内容不仅会告诉我们哪些文档被匹配到,而且这些文档完整的内容也包含在其中。
在 MySQL 中进行简单的条件查询使用关键字 WHERE
,在 Elasticsearch 中我们使用 GET 索引/_search?q=filed:value
来查询。如下图所示,我们查询 author:唐
没有查出结果,而查询 author:唐家三少
查出了结果。这时为什么呢?我们知道 ES 是倒排索引,如果没有找到 唐
就没有结果,那么是不是 author Field 域没有分词或者没有分出 唐
这个词。
我们先来看一下这个索引中的数据类型,author
是 keyword 类型的,我们知道 keyword 类型的不会被分词,只能作为一个整体查询。所以我们猜测 author
没有被分词是正确的是正确的。
我们再来看看 title
这个数据类型可是 text,是会被分词的。如下图所示,我们明明查询的是 title:斗罗
为什么 斗破苍穹 中没有 斗罗 也会被查出来。这是因为我们没有指定 title
的分词器,它就是用了默认的分词器,在查询时,会按照存储时的规则来。所以查询 title:斗罗
时会拆分为 斗、罗 两个字去查询。
全值检索使用 term
具体语法如下图所示,我们查询 title:斗罗
,但是结果为空。不对啊?我们之前查询是有两条结果的呀!顾名思义,全值检索,就是将关键字作为一个词,不分词的去查询,而 title
使用的是默认分词器,被拆分为只有一个字的 term,所以无法匹配。
模糊检索使用 fuzzy
具体语法如下图所示,需要注意的是该关键字会被当作一个整体去匹配 term,不会被分词(不论添加时该 Field 是否分词)。同时根据 term 的长度,被模糊的程度也有相应的限制,不可能四个字只有一个字对也能查出来。
如上图所示,就可以显示需要的 field,但是,其实我们这里省略了包含属性 includes
,完整的写法如下图所示。那么,有包含肯定有排除,不然需要显示的 field 有 99%,不需要显示的 field 只有 1%,岂不是要疯。排除使用 excludes
。
如下图所示,我们可以指定按照那个 field 升序或降序排序,默认是根据匹配度 _score
分值降序排列的。