向量数据库更新 Document

接口定义
update() 接口用于对通过主键（Document ID）与 Filter 表达式过滤检索 Document，对 Document 的部分字段进行更新，同时支持新增字段。
def update(self,
           database_name: str,
           collection_name: str,
           data: Union[Document, Dict],
           filter: Union[Filter, str] = None,
           document_ids: Optional[List[str]] = None,
           timeout: Optional[float] = None)
使用示例
说明：
新增字段，在创建 Collection 时没有为这些字段设置索引，那么新增这些字段时，系统不会自动为其创建索引。
不能变更 Document ID 字段，不要求事务完整性。
更新向量数据
更新原始文本
集合未配置 Embedding 参数，则直接更新向量数据。如下示例，在集合 book-vector 中，基于 upsert() 插入的向量数据，通过 documentIds 与 filter 表达式，过滤出需更新的 Document，更新其 vectors 字段的向量数据，并更新 page 字段值为30，新增字段 test_new_field。
import tcvectordb
from tcvectordb.model.document import Document, Filter, SearchParams
﻿
#create a database client object
client = tcvectordb.RPCVectorDBClient(url='http://10.0.X.X:80', username='root', key='eC4bLRy2va******************************', read_consistency=ReadConsistency.EVENTUAL_CONSISTENCY, timeout=30)
#设置需更新的字段，或增加新的字段
update_doc = Document(
        vector=[0.2123, 0.290, 0.213], 
        page=30, 
        test_new_field="new field value"
        )
# 对满足查询条件的 Document 更新字段
res = client.update(
        database_name='db-test',
        collection_name='book-vector',
        data=update_doc, 
        document_ids=['0001','0002','0003'], 
        #filter=Filter(Filter.In("bookName",["三国演义", "西游记"]))
        filter='bookName in ("三国演义","西游记")'
        )
print(res, flush=True)
实例在创建 Collection 时，已配置 Embedding 模型，通过 upsert() 写入原始文本，则可输入文本信息，通过 Embedding 将数据向量化更新向量数据。如下示例，基于 upsert() 插入的原始文本，使用 update 接口，通过 documentIds 与 filter 表达式过滤数据，更新其 text 字段的文本信息，更新 page 字段值为30，并新增字段 test_new_field。
import tcvectordb
from tcvectordb.model.document import Document, Filter
﻿
#create a database client object
client = tcvectordb.RPCVectorDBClient(url='http://10.0.X.X', username='root', key='eC4bLRy2va******************************', read_consistency=ReadConsistency.EVENTUAL_CONSISTENCY, timeout=30)
﻿
# 设置需更新的字段
update_doc = Document(text="分久必合，合久必分", page=30, test_new_field="new field value")
# 对满足查询条件的 Document 更新字段
res = client.update(
                database_name='db-test',
                collection_name='book-emb-1012',
                data=update_doc, 
                document_ids=['0001', '0002','0003'], 
                #filter=Filter(Filter.In("bookName",["三国演义", "西游记"]))
                filter='bookName in ("三国演义","西游记")'
                )
print(res, flush=True)
入参描述
参数名称
参数含义
子参数
是否必选
配置方法
database_name
指定更新的数据库名。
-
是
Database 命名要求如下：
只能使用英文字母，数字，下划线_、中划线-，并以英文字母开头。
长度要求：[1,128]。
collection_name
指定更新的集合名。
-
是
Collection 命名要求如下：
只能使用英文字母，数字，下划线_、中划线-，并以英文字母开头。
长度要求：[1,128]。
document_ids
表示要更新的 Document 的 ID。
-
是
ID 长度限制为[1,128]。
批量删除，数据元素最大值为20。
filter
使用创建 Collection 指定的 Filter 索引的字段设置查询过滤表达式
-
否
Filter 的表达式格式为 '<field_name><operator><value>'，多个表达式之间支持 and（与）、or（或）、not（非）关系。具体信息，请参见 Filter 条件表达式。其中 
<field_name>：表示要过滤的字段名。
<operator>：表示要使用的运算符。
string ：匹配单个字符串值（=）、匹配任意一个字符串值（in）、排除所有字符串值（not in）。其对应的 Value 必须使用英文双引号括起来。
uint64/int64/double：大于（>）、大于等于（>=）、等于（=）、小于（<）、小于等于（<=）、不等于（!=）。例如：expired_time > 1623388524。
array：数组类型，包含数组元素之一（include）、排除数组元素之一（exclude）、全包含数组元素（include all）。例如，name include (\\"Bob\\", \\"Jack\\")。
json：json 类型的 Filter 表达式语法和 json 字段的键值类型保持一致。若访问 Json 对象中的键，使用点（.）符号连接。例如：Json 类型的字段 bookInfo ，其键 bookName 的 Filter 表达式如下所示。更多信息，请参见 Json 类型表达式。
filter_param='bookInfo.bookName in ("三国演义","西游记")'
Running Environment
Operating System: Ubuntu 24.04.3 LTS / x86_64
Runtime Version: Python 3.11.1
<value>：表示要匹配的值。

data

设置需更新的字段，或新增字段。
vector
否
更新 vector 字段的向量数据。
说明：
如果 Collection 在创建时，未配置 Embedding 参数，或者该实例并未开通 Embedding 功能，则只能配置该参数，输入向量数据，更新数据。
﻿
﻿
text
否
Embedding 模型输入文本的字段名。该字段在创建 Collection 时定义。本示例为 text 。
string：字符型。
float：浮点型数据。
说明：
如果 Collection 在创建时，已配置 Embedding 参数，则只能配置该参数，依据输入的文本信息更新向量数据，并将文本字段与向量数据更新存于数据库。
﻿
﻿
old_field
否
当前已存在的字段，更新字段对应的数据。
类型：string。
字符长度要求：[1,256]。
﻿
﻿
new_field
否
新增字段，并给新字段赋值。
类型：string。
字符长度要求：[1,256]。
timeout
请求超时时间。
-
否
单位：秒。
默认值：VectorDBClient() 接口配置的 timeout 时长。
取值范围：大于等于0。
出参描述
{
    'code': 0, 
    'msg': 'Operation success', 
    'affectedCount': 2
}
Running Environment
Operating System: Ubuntu 24.04.3 LTS / x86_64
Runtime Version: Python 3.11.1
参数名
参数含义
affectedCount
影响行数，即为更新数据的条数。

参数名	参数含义
affectedCount	影响行数，即为更新数据的条数。

参数名称	参数含义	子参数	是否必选	配置方法
database_name	指定更新的数据库名。	-	是	Database 命名要求如下：只能使用英文字母，数字，下划线_、中划线-，并以英文字母开头。长度要求：[1,128]。
collection_name	指定更新的集合名。	-	是	Collection 命名要求如下：只能使用英文字母，数字，下划线_、中划线-，并以英文字母开头。长度要求：[1,128]。
document_ids	表示要更新的 Document 的 ID。	-	是	ID 长度限制为[1,128]。批量删除，数据元素最大值为20。
filter	使用创建 Collection 指定的 Filter 索引的字段设置查询过滤表达式	-	否	Filter 的表达式格式为 '<field_name><operator><value>'，多个表达式之间支持 and（与）、or（或）、not（非）关系。具体信息，请参见 Filter 条件表达式。其中 <field_name>：表示要过滤的字段名。 <operator>：表示要使用的运算符。 string ：匹配单个字符串值（=）、匹配任意一个字符串值（in）、排除所有字符串值（not in）。其对应的 Value 必须使用英文双引号括起来。 uint64/int64/double：大于（>）、大于等于（>=）、等于（=）、小于（<）、小于等于（<=）、不等于（!=）。例如：expired_time > 1623388524。 array：数组类型，包含数组元素之一（include）、排除数组元素之一（exclude）、全包含数组元素（include all）。例如，name include (\\"Bob\\", \\"Jack\\")。 json：json 类型的 Filter 表达式语法和 json 字段的键值类型保持一致。若访问 Json 对象中的键，使用点（.）符号连接。例如：Json 类型的字段 bookInfo ，其键 bookName 的 Filter 表达式如下所示。更多信息，请参见 Json 类型表达式。 filter_param='bookInfo.bookName in ("三国演义","西游记")' Running Environment Operating System: Ubuntu 24.04.3 LTS / x86_64 Runtime Version: Python 3.11.1 <value>：表示要匹配的值。
data	设置需更新的字段，或新增字段。	vector	否	更新 vector 字段的向量数据。说明：如果 Collection 在创建时，未配置 Embedding 参数，或者该实例并未开通 Embedding 功能，则只能配置该参数，输入向量数据，更新数据。
				text	否	Embedding 模型输入文本的字段名。该字段在创建 Collection 时定义。本示例为 text 。 string：字符型。 float：浮点型数据。说明：如果 Collection 在创建时，已配置 Embedding 参数，则只能配置该参数，依据输入的文本信息更新向量数据，并将文本字段与向量数据更新存于数据库。
				old_field	否	当前已存在的字段，更新字段对应的数据。类型：string。字符长度要求：[1,256]。
				new_field	否	新增字段，并给新字段赋值。类型：string。字符长度要求：[1,256]。
timeout	请求超时时间。	-	否	单位：秒。默认值：VectorDBClient() 接口配置的 timeout 时长。取值范围：大于等于0。

更新 Document

本页目录：

接口定义

使用示例

入参描述

Running Environment

出参描述

Running Environment