向量数据库检索方式

检索方法
解释
功能明细
相似性检索
基于多维向量进行 相似性计算 的检索方式，通过计算查询向量与数据库存储的向量之间的相似度，找到与查询的多维向量最相似的文档。
支持指定多维向量数值，检索与指定的多维向量数值最相似的 Top K 条文档。
支持指定 id（Document ID），检索与该 id 的向量值最相似的 Top K 条文档。
支持输入原始文本，检索与该文本信息最相似的 Top K 条文档。
支持指定 id、多维向量或原始文本，搭配标量字段的 Filter 表达式一并检索与 id、多维向量、原始文本相似的文档。
支持批量进行相似度检索，即支持输入多条向量数据值、多个 id 分别检索与每一个向量数值、每一个 id 相似的 Top K 条数据。
精确查询
基于数据的标量字段（指一个单独的数值，例如文本、数值或日期等字段），精确检索具体数据的查询方式。例如，根据 id（Document ID）查询对应向量数据，或者根据文件名查询。适用于根据单个属性进行数据查询的场景。
支持根据指定的文件 id（DocumentSet ID）或文件名，检索对应的文件信息。
支持指定多个文件 id（DocumentSet ID）或文件名，单次批量查询对应的多个文件，最大数量为20个。
支持指定标量字段的 Filter 条件表达式 过滤文件信息。
支持指定查询起始位置和返回数量，查询该范围的文件。
支持指定多个文件 id（DocumentSet ID）或文件名，并搭配标量字段的 Filter 表达式一起过滤数据。
过滤检索
基于标量字段的 Filter 条件表达式 过滤需检索的信息，并对已过滤的数据进行向量相似性计算，获取与输入文本或向量数据最相似的数据。
在精确查询时，支持指定 Filter 字段的条件表达式过滤需查询的文档。
在相似度检索时，支持指定 Filter 字段的条件表达式过滤需检索的文档。
在删除数据时，支持指定 Filter 字段的条件表达式过滤需删除的文档。
在更新数据时，支持指定 Filter 字段的条件表达式过滤需更新的文档。
混合检索
支持稠密向量 Dense vector + 稀疏向量 Sparse vector 混合检索双路召回。Sparse vector 通过BM25算法完成分数计算达到类关键字检索效果，进一步提升业务召回效果，弥补在语义检索中对具体数字、编码、数学公式等不敏感以及语义过度泛化的问题。
支持文本内容转化稀疏向量表示。
支持 RFF、Weight 两路权重合并排序。

检索方法	解释	功能明细
相似性检索	基于多维向量进行相似性计算的检索方式，通过计算查询向量与数据库存储的向量之间的相似度，找到与查询的多维向量最相似的文档。	支持指定多维向量数值，检索与指定的多维向量数值最相似的 Top K 条文档。支持指定 id（Document ID），检索与该 id 的向量值最相似的 Top K 条文档。支持输入原始文本，检索与该文本信息最相似的 Top K 条文档。支持指定 id、多维向量或原始文本，搭配标量字段的 Filter 表达式一并检索与 id、多维向量、原始文本相似的文档。支持批量进行相似度检索，即支持输入多条向量数据值、多个 id 分别检索与每一个向量数值、每一个 id 相似的 Top K 条数据。
精确查询	基于数据的标量字段（指一个单独的数值，例如文本、数值或日期等字段），精确检索具体数据的查询方式。例如，根据 id（Document ID）查询对应向量数据，或者根据文件名查询。适用于根据单个属性进行数据查询的场景。	支持根据指定的文件 id（DocumentSet ID）或文件名，检索对应的文件信息。支持指定多个文件 id（DocumentSet ID）或文件名，单次批量查询对应的多个文件，最大数量为20个。支持指定标量字段的 Filter 条件表达式过滤文件信息。支持指定查询起始位置和返回数量，查询该范围的文件。支持指定多个文件 id（DocumentSet ID）或文件名，并搭配标量字段的 Filter 表达式一起过滤数据。
过滤检索	基于标量字段的 Filter 条件表达式过滤需检索的信息，并对已过滤的数据进行向量相似性计算，获取与输入文本或向量数据最相似的数据。	在精确查询时，支持指定 Filter 字段的条件表达式过滤需查询的文档。在相似度检索时，支持指定 Filter 字段的条件表达式过滤需检索的文档。在删除数据时，支持指定 Filter 字段的条件表达式过滤需删除的文档。在更新数据时，支持指定 Filter 字段的条件表达式过滤需更新的文档。
混合检索	支持稠密向量 Dense vector + 稀疏向量 Sparse vector 混合检索双路召回。Sparse vector 通过BM25算法完成分数计算达到类关键字检索效果，进一步提升业务召回效果，弥补在语义检索中对具体数字、编码、数学公式等不敏感以及语义过度泛化的问题。	支持文本内容转化稀疏向量表示。支持 RFF、Weight 两路权重合并排序。