图片主体检测

最近更新时间:2024-10-28 16:06:21

我的收藏

简介

本文档提供关于图像主体检测的相关 API 概览以及 SDK 示例代码。
API
操作描述
图像主体检测

图像主体检测

功能说明

腾讯云数据万象通过 AIObjectDetect 接口实现对图片内不同主体的识别,返回图片中识别到主体 的名称、坐标、置信度分值。

示例代码

from qcloud_cos import AIRecognitionClient
from qcloud_cos import CosConfig
# 替换为用户的 SecretId,请登录访问管理控制台进行查看和管理,https://console.cloud.tencent.com/cam/capi
secret_id = os.environ["SECRETID"] # 替换为用户的 SecretKey,请登录访问管理控制台进行查看和管理,https://console.cloud.tencent.com/cam/capi secret_key = os.environ["SECRETKEY"] # 替换为用户的 region,已创建桶归属的region可以在控制台查看,https://console.cloud.tencent.com/cos5/bucket region = 'ap-chongqing' # COS支持的所有region列表参见https://www.qcloud.com/document/product/436/6224
# 如果使用永久密钥不需要填入token,如果使用临时密钥需要填入,临时密钥生成和使用指引参见https://cloud.tencent.com/document/product/436/14048 token = None
config = CosConfig(Region=region, SecretId=secret_id, SecretKey=secret_key, Token=token) client = AIRecognitionClient(config)
def cos_create_ai_object_detect_job():
# 图像主体检测
# demo地址:https://github.com/tencentyun/cos-python-sdk-v5/blob/master/demo/ai_recognition_demo.py#L57
response, data = client.cos_create_ai_object_detect_job(
Bucket=bucket_name,
ObjectKey = "objectKey",
)
print(response)
print(data)
return response, data

参数说明

调用 cos_create_ai_object_detect_job 函数,具体请求参数如下:
参数名称
参数描述
类型
是否必填
Bucket
存储桶名称
String
ObjectKey
设置对象名称
String
DetectUrl
您可以通过填写 detect-url 处理任意公网可访问的图片链接。不填写 detect-url 时,后台会默认处理 ObjectKey ,填写了 detect-url 时,后台会处理 detect-url 链接,无需再填写 ObjectKey。 detect-url 示例:http://www.example.com/abc.jpg ,需要进行 UrlEncode,处理后为 http%25253A%25252F%25252Fwww.example.com%25252Fabc.jpg
String

返回结果说明

response 为响应头,data 为图像主体检测结果,数据类型都为 dict。
response 内容
返回公共响应头部,详情请参见 公共响应头部 文档。
响应体 data
响应体具体数据内容如下:
参数名称
参数描述
类型
Status
主体识别结果状态。0表示未识别到,1表示识别到。
Integer
DetectMultiObj
主体识别结果,可能有多个。
Container Array
DetectMultiObj 节点内容:
参数名称
参数描述
类型
Name
识别到主体的名称。
String
Confidence
识别到主体的置信度,取值范围为[0-100]。值越高概率越大。
Integer
Location
图中识别到主体的坐标。
Container
Location 节点内容:
参数名称
参数描述
类型
X
识别主体框左上角横坐标。
Integer
Y
识别主体框左上角纵坐标。
Integer
Width
识别主体框高度。
Integer
Height
识别主体框高度。
Integer