简介
创建数据集功能是由 数据万象(Cloud Infinite,CI)提供的,数据万象将处理能力与 COS SDK 完全结合,您可以直接按照本篇文档指引进行使用。
本文档提供关于创建数据集的相关 API 概览以及 SDK 示例代码。
注意:
API | 操作描述 |
创建数据集 |
创建数据集
功能说明
本接口用于创建一个数据集(Dataset),数据集是由文件元数据构成的集合,用于存储和管理元数据。
方法原型
public CreateDatasetResponse createDataset(CreateDatasetRequest customRequest)
请求示例
CreateDatasetRequest request = new CreateDatasetRequest();request.setAppId("1234567890");// 设置数据集名称,同一个账户下唯一。命名规则如下: 长度为1~32字符。 只能包含小写英文字母,数字,短划线(-)。 必须以英文字母和数字开头。;是否必传:是request.setDatasetName("test");// 设置数据集描述信息。长度为1~256个英文或中文字符,默认值为空。;是否必传:否request.setDescription("test");// 设置 与数据集关联的检索模板,在建立元数据索引时,后端将根据检索模板来决定采集文件的哪些元数据。每个检索模板都包含若干个算子,不同的算子表示不同的处理能力,更多信息请参见 [检索模板与算子](https://cloud.tencent.com/document/product/460/106018)。 默认值为空,即不关联检索模板,不进行任何元数据的采集。;是否必传:否request.setTemplateId("Official:COSBasicMeta");CreateDatasetResponse response = client.createDataset(request);
参数说明
Request: 中的具体数据描述如下
参数名称 | 描述 | 类型 | 是否必传 |
AppId | String | 是 | |
datasetName | 数据集名称,同一个账户下唯一。命名规则如下: 长度为1~32字符。 只能包含小写英文字母,数字,短划线(-)。 必须以英文字母和数字开头。 | String | 是 |
description | 数据集描述信息。长度为1~256个英文或中文字符,默认值为空。 | String | 否 |
templateId | 与数据集关联的检索模板,在建立元数据索引时,后端将根据检索模板来决定采集文件的哪些元数据。每个检索模板都包含若干个算子,不同的算子表示不同的处理能力,更多信息请参见 检索模板与算子。 默认值为空,即不关联检索模板,不进行任何元数据的采集。 | String | 否 |
响应参数说明:
CreateDatasetResponse 中的具体数据描述如下:
参数名称 | 描述 | 类型 |
requestId | 请求 ID | String |
dataset | 数据集信息 | Container |
Dataset 中的具体数据描述如下:
参数名称 | 描述 | 类型 |
region | 园区信息 | String |
templateId | 检索模板 | String |
description | 数据集描述信息 | String |
createTime | 数据集创建时间的时间戳,格式为 RFC3339Nano | String |
updateTime | 数据集修改时间的时间戳,格式为 RFC3339Nano 创建数据集后,如果未更新过数据集,则数据集修改时间的时间戳和数据集创建时间的时间戳相同 | String |
bindCount | 数据集当前绑定的 COS Bucket 数量 | Integer |
fileCount | 数据集当前文件数量 | Integer |
totalFileSize | 数据集中当前已建立了元数据索引的文件的总大小,单位为字节。 | Integer |
datasetName | 数据集名称 | String |
返回结果说明
成功:返回 CreateDatasetResponse 对象响应信息。
失败:发生错误(如 Bucket 不存在),抛出异常 CosClientException 或者 CosServiceException。详情请参见 异常处理。