智能擦除接入

最近更新时间:2026-04-30 11:47:31

我的收藏

智能擦除功能简介

智能擦除能够对视频画面中的 Logo、字幕、人脸和车牌等元素进行模糊、马赛克或无痕化处理,从而便于内容的传播和分享。该功能广泛应用于短剧平台、短视频平台、跨境电商以及自媒体工作室等多个领域。

前置操作

在接入前,为正常使用此能力,您需要在 云点播控制台媒体处理 > 媒体处理模板 > 媒体智能模板中开通 MPS 服务。
注意:
智能擦除功能由媒体处理(MPS)提供服务,使用前需同时开通 VOD 和 MPS 服务
功能用量及账单将在媒体处理(MPS)平台显示。定价请参考 MPS 媒体 AI 按量计费


使用方式

方式一、控制台使用

发起任务

您可以进入 云点播控制台 智能媒资管理 > 音视频管理页面发起任务。
1. 选择需要发起任务的视频,并单击媒体处理

2. 处理类型选择“媒体智能”的智能分析,选择25号预设模板。开启更多设置的扩展参数,参考下文 扩展参数说明,传入所需参数。
说明:
25号预设模板默认为智能擦除-去水印基础版功能。如需发起视频译制任务,必须传入扩展参数,否则仅对视频进行去水印处理。
控制台会自动转义,请直接传入 JSON 数据,不要传入转义后的字符串,否则会导致任务失败。


查看任务结果

1. 云点播控制台 任务中心页面,找到对应任务并单击详情查看结果。


2. 生成结果将作为新的视频存储在 VOD,您可以在控制台查看生成结果。


方式二、API 接入

发起任务

调用 ProcessMediaByMPS,FileID 填写需要处理的媒资 ID, SubAppID 填入子应用 ID, MPSProcessMediaParams 参数中, 填写 AiAnalysisTask 任务,并将 Definition 设置为 25(预置模板)。ExtendedParameter 根据需求填额外的扩展参数,通过该参数实现特定的能力。
智能擦除任务 MPSProcessMediaParams 参数示例如下:
{"AiAnalysisTask":{"Definition":25,"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\"}}"}}


查询任务结果

使用 云点播查询任务详情云点播获取任务列表 查询任务。可以在输出信息中找到输出文件路径。


分场景 ExtendedParameter 传参示例

智能擦除最常用的原子能力为去字幕,为支持短剧出海、视频转译等业务,还支持在去字幕的同时进行:
OCR 提取字幕并翻译:将字幕提取出来并进行翻译,生成翻译语言字幕文件。
音频合成:输入去字幕后的无痕视频,以及校准后的翻译语言字幕文件,生成带有翻译语言配音的新视频。
字幕压制:将字幕压制到视频画面中。
除此之外,智能擦除还支持:
去 Logo:去除视频上的 Logo。
隐私保护处理:将人脸、车牌进行模糊或马赛克处理。
使用不同能力,可以参考下文介绍,传入对应的 ExtendedParameter。

一、去字幕

计费说明

使用去字幕功能,含自动擦除、指定区域擦除、漏擦区域二次处理,不区分“区域版”、“标准版”模型,均收取“去字幕”费用,定价请参考 智能擦除计费说明

1.1 去字幕(自动擦除)

去字幕(自动擦除)指通过 AI 模型自动识别视频中的字幕文本内容,进行无痕化擦除,生成新的视频。画面干扰、特殊字幕样式可能会带来一定漏擦、误擦问题,您可以通过去字幕(指定区域擦除)处理。
使用去字幕(自动擦除)能力,ExtendedParameter 基础传参如下:
转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\"}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast"
}
}
指定字幕大致位置,保护无需擦除的视频区域
去字幕功能默认会自动识别视频画面中部靠下的文字区域,并对这些文字区域进行擦除。
若您的视频类似下方示例,中部靠下部分有其他无需擦除的文字内容,您可以通过 als_filter 参数指定字幕的大致位置来减少误擦问题。
左:原始视频(底部“不顾一切爱上你”无需擦除)。中:使用 als_filter 指定字幕位置的擦除效果。右:未指定 als_filter 的擦除效果。
左:原始视频(底部“不顾一切爱上你”无需擦除)。中:使用 als_filter 指定字幕位置的擦除效果。右:未指定 als_filter 的擦除效果。

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"als_filter\\":{\\"active_areas\\":[{\\"lt_x\\":0.097,\\"lt_y\\":0.626,\\"rb_x\\":0.928,\\"rb_y\\":0.705}]}}}

/*
als_filter: 自动擦除区域,用于指定字幕的大致位置来减少画面干扰造成的误擦问题。
(lt_x,lt_y)为区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:
[ 0, 1 ] :表示占视频宽或高的比例
( 1, + ) :表示像素
*/
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast",
"als_filter": {
"active_areas": [
{
"lt_x": 0.097,
"lt_y": 0.626,
"rb_x": 0.928,
"rb_y": 0.705
}
]
}
}
}
若您希望自动擦除全屏文字内容,则可以将 als_filter 的区域大小尽量设为视频全屏大小,参考如下:
转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"als_filter\\":{\\"active_areas\\":[{\\"lt_x\\":0,\\"lt_y\\":0,\\"rb_x\\":0.9999,\\"rb_y\\":0.9999}]}}}

/*
als_filter: 自动擦除区域,用于指定字幕的大致位置来减少画面干扰造成的误擦问题。
(lt_x,lt_y)为区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:
[ 0, 1 ] :表示占视频宽或高的比例
( 1, + ) :表示像素
*/
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast",
"als_filter": {
"active_areas": [
{
"lt_x": 0,
"lt_y": 0,
"rb_x": 0.9999,
"rb_y": 0.9999
}
]
}
}
}

1.2 去字幕(指定区域擦除)

去字幕(自动擦除)通常能自动识别出较准确的字幕位置,但在某些特殊情况下可能会出现漏擦问题,例如下图情况:
左:红框部分字幕和背景对比度过小。右:字幕样式为花体且有渐变特效。
左:红框部分字幕和背景对比度过小。右:字幕样式为花体且有渐变特效。

因此,若您的字幕位置较固定,建议您通过 custom_objs 直接指定擦除区域,最大程度减少漏擦的情况。
说明:
指定 custom_objs 后,系统将直接擦除所选区域,不会自动识别或擦除视频中其他位置的文字内容。因此,请完整传入目标擦除区域。
示例:
左:原始视频。中:绿框表示 custom_objs 指定的擦除区域。右:擦除效果。
左:原始视频。中:绿框表示 custom_objs 指定的擦除区域。右:擦除效果。

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":53,\\"lt_y\\":228,\\"rb_x\\":137,\\"rb_y\\":644}}]}]}}}

/*
您可以指定多个擦除区域(不建议超过10个)。
(lt_x,lt_y)为擦除区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:
[ 0, 1 ) :表示占视频宽/高的比例
[ 1, + ) :表示像素
*/
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_fast",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 2,
"score": 100,
"rect": {
"lt_x": 53,
"lt_y": 228,
"rb_x": 137,
"rb_y": 644
}
}
]
}
]
}
}
}

1.3 针对特殊样式字幕

去字幕提供两种模型版本,适用于不同的字幕样式:
标准版(推荐):通常建议选择该版本,适用于字幕样式标准的视频,无痕化效果更好,细节还原更优。
CustomerAppId 传入 subtitle_erase_fast,表示使用“标准版”。
左:原始视频。中:区域版处理效果。右:标准版处理效果。若您视频中的字幕样式类似该示例,请选择标准版。
左:原始视频。中:区域版处理效果。右:标准版处理效果。若您视频中的字幕样式类似该示例,请选择标准版。

区域版:适用于特殊样式字幕(如背景阴影、花体、动效),擦除面积更大,但无痕效果不如标准版。
指定“区域版”, CustomerAppId 传入 subtitle_erase_area。示例:
左:原始视频。中:绿框表示 custom_objs 指定的擦除区域。右:擦除效果(因字幕样式特殊,使用区域版去字幕模型)
左:原始视频。中:绿框表示 custom_objs 指定的擦除区域。右:擦除效果(因字幕样式特殊,使用区域版去字幕模型)

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_area\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":879,\\"lt_y\\":169,\\"rb_x\\":997,\\"rb_y\\":761}}]}]}}}

/*
subtitle_erase_area,表示使用“区域版”去字幕模型,适用于特殊样式字幕。
您可以指定多个擦除区域(不建议超过10个)。
(lt_x,lt_y)为擦除区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:
[ 0, 1 ) :表示占视频宽或高的比例
[ 1, + ) :表示像素
*/
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_area",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 2,
"score": 100,
"rect": {
"lt_x": 879,
"lt_y": 169,
"rb_x": 997,
"rb_y": 761
}
}
]
}
]
}
}
}

1.4 字幕漏擦区域二次处理

如果使用去字幕(自动擦除)处理后,还有一些漏擦区域,通常是字幕样式、视频背景等造成的影响。您可以将去字幕模型改为“区域版”(subtitle_erase_area),并通过 custom_objs 指定漏擦区域位置来进行修复。您还可以通过 begin_msend_ms 字段指定需二次处理的时间段。注意,为保证修复效果,漏擦区域位置、时间段需尽量准确。
说明:
由于去字幕输出视频需要为完整视频进行编解码,因此按输出视频的总时长计费,而不是按 begin_ms end_ms 字段指定的擦除处理时间段计费。
转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_area\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"begin_ms\\":3000,\\"end_ms\\":5000,\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.0,\\"lt_y\\":10,\\"rb_x\\":10,\\"rb_y\\":20}}]}]}}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_area",
"custom_objs": {
"type": 0,
"time_objs": [
{
"begin_ms": 3000,
"end_ms": 5000,
"objs": [
{
"type": 2,
"score": 100,
"rect": {
"lt_x": 0.0,
"lt_y": 10,
"rb_x": 10,
"rb_y": 20
}
}
]
}
]
}
}
}

二、配音级译制(同时去字幕 + OCR 提取字幕 + 翻译字幕 + 字幕压制 + AI 配音)

左:原视频中文字幕中文语音;右:处理后生成多语言字幕和语音;
左:原视频中文字幕中文语音;右:处理后生成多语言字幕和语音;

配音级视频译制功能可以自动识别视频中的原始字幕,进行精准擦除和大模型翻译,并将翻译后的字幕无缝压制到视频中,同时提供自然流畅的 AI 配音,提升观赏体验。详细使用指引请参考 一站式译制接入

三、字幕级译制(同时去字幕 + OCR 提取字幕 + 翻译字幕 + 字幕压制)

输入带有原语言字幕的视频,输出带有翻译语言字幕的视频(不含 AI 配音)。
左图:原始中文短视频;右图:处理后输出视频具有英文字幕。
左图:原始中文短视频;右图:处理后输出视频具有英文字幕。


计费说明

收取“去字幕”+“OCR 提取字幕并翻译+压制字幕”费用,定价请参考 智能擦除计费说明
示例如下:
转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_and_translate\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"en\\"}}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_erase_and_translate",
"subtitle_param": {
"translate_dst_language": "en"
}
}
}

四、去 Logo

去 Logo 表示擦除视频画面中的 Logo、图标、用户头像等图形内容,支持基础版和高级版两种模式:
基础版:基础模糊效果,性价比高,适合动画或背景较干净的视频。收取“智能擦除基础费用(去 Logo-基础版)”费用。
高级版:擦除效果更好,适合短剧等现实风格视频。收取“去 Logo-高级版”费用。
左:原始视频,红框内为 Logo 位置。中:基础版处理效果。右:高级版处理效果
左:原始视频,红框内为 Logo 位置。中:基础版处理效果。右:高级版处理效果


4.1 去 Logo 高级版

相比去 Logo 基础版,高级版擦除效果更好。CustomerAppId 传入 ai_delogo_v1 表示使用去 Logo 高级版。
支持自动擦除和指定区域擦除两种处理方式:
自动擦除:利用 AI 模型,自动识别视频全屏画面中的 Logo 并进行擦除,支持静态和位置变化的 Logo。
目前,我们支持十多种常见互联网 Logo,对于不在支持范围内的 Logo,我们也提供定制化训练服务,这将单独收取模型训练费用。
画面干扰可能会给自动擦除带来负面影响,造成一定漏擦误擦,这种情况可以通过指定区域擦除进行二次修复。
指定区域擦除:对于位置固定的静态 Logo,建议使用指定区域擦除,减少漏擦误擦问题。
红框:不断移动的动态 Logo,建议使用自动擦除(非常见互联网 Logo 需进行模型训练)。绿框:位置固定的静态 Logo,使用指定区域擦除即可去除。
红框:不断移动的动态 Logo,建议使用自动擦除(非常见互联网 Logo 需进行模型训练)。绿框:位置固定的静态 Logo,使用指定区域擦除即可去除。

计费说明
使用去 Logo 高级版,收取“去 Logo-高级版”费用,定价请参考 智能擦除计费说明
4.1.1 自动擦除
左:原始视频,左上右上各有一个 Logo/图标。右:去水印高级版自动擦除效果
左:原始视频,左上右上各有一个 Logo/图标。右:去水印高级版自动擦除效果

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\"}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "ai_delogo_v1"
}
}
4.1.2 自动擦除基础上,指定需擦除的 Logo 位置,保护无需擦除的区域
自动擦除功能默认会去除全局识别到的 Logo。如果传入 als_filter,可以指定 Logo 的大致位置,系统在自动擦除时将过滤掉该区域外的 Logo,从而保护不需要擦除的视频部分。
左:原始视频,左上右上各有一个 Logo/图标。右:只擦除右上角图标内容。
左:原始视频,左上右上各有一个 Logo/图标。右:只擦除右上角图标内容。

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\",\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":1,\\"lt_x\\":527,\\"lt_y\\":13,\\"rb_x\\":701,\\"rb_y\\":78}]}}}

/*
als_filter: 自动提取区域,用于指定字幕的大致位置来减少误检问题。
(lt_x,lt_y)为区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:
[ 0, 1 ] :表示占视频宽或高的比例
( 1, + ) :表示像素
*/
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "ai_delogo_v1",
"als_filter": {
"active_areas": [
{
"type": 1,
"lt_x": 527,
"lt_y": 13,
"rb_x": 701,
"rb_y": 78
}
]
}
}
}
4.1.3 指定区域擦除
自动擦除只支持处理 MPS 模型库内的 Logo。对于非常见互联网 Logo,一般不在 MPS 模型库中,可按以下两种情况处理:
Logo 位置动态变化:需通过训练模型实现擦除,此过程将额外收取模型训练费用。
Logo 位置固定:可通过 custom_objs 直接指定擦除区域,完成去除,无需额外模型训练费用。示例如下:
左图:原始视频,红框内为指定 Logo 擦除区域;右图:擦除效果
左图:原始视频,红框内为指定 Logo 擦除区域;右图:擦除效果

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "ai_delogo_v1",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 1,//水印去除,type设置为1
"value": "customobjs",
"score": 100,
"rect": {
"lt_x": 0.024,
"lt_y": 0.027,
"rb_x": 0.14,
"rb_y": 0.198
}
}
]
}
]
}
}
}

4.2 去 Logo 基础版

去 Logo 基础版为模糊擦除效果,也支持自动擦除和指定区域擦除两种使用方式。
计费说明
使用去 Logo 基础版,含自动擦除和指定区域擦除,收取“智能擦除基础费用(去 Logo-基础版)”费用,定价请参考 智能擦除计费说明
4.2.1 自动擦除
若 ExtendedParameter 不填,则为去 Logo 基础版(自动擦除)场景,全屏识别 Logo。
左:原始视频,左上右上各有一个 Logo/图标。中:去 Logo 基础版(自动擦除)效果。
左:原始视频,左上右上各有一个 Logo/图标。中:去 Logo 基础版(自动擦除)效果。

转义后的字符串
未转义 JSON
ExtendedParameter 不传即可。

ExtendedParameter 不传即可。
4.2.2 指定区域擦除
同去 Logo 高级版,基础版自动擦除也只支持处理 MPS 模型库内的 Logo。对于非常见互联网 Logo,一般不在 MPS 模型库中,可按以下两种情况处理:
Logo 位置动态变化:需通过训练模型实现擦除,此过程将额外收取模型训练费用。
Logo 位置固定:可通过 custom_objs 直接指定擦除区域,完成去除,无需额外模型训练费用。示例如下:
转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 1,//水印去除,type设置为1
"value": "customobjs",
"score": 100,
"rect": {
"lt_x": 0.024,
"lt_y": 0.027,
"rb_x": 0.14,
"rb_y": 0.198
}
}
]
}
]
}
}
}

五、同时去字幕 + 去 Logo

计费说明

同时去字幕 + 去 Logo,收取“去 Logo-高级版”和“去字幕”费用,定价请参考 智能擦除计费说明

操作指引

当视频中同时存在字幕(文字内容)和 Logo(图形内容)时,可以将 CustomerAppId 指定为 subtitle_logo_erase,同时进行去字幕和去 Logo 处理。
对于常见互联网 Logo,您无需指定 Logo 位置,系统会自动擦除,只需通过 als_filter 指定字幕所在位置。
左图:原始视频;右图:擦除效果
左图:原始视频;右图:擦除效果

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_logo_erase\\",\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":2,\\"lt_x\\":0.106,\\"lt_y\\":0.733,\\"rb_x\\":0.901,\\"rb_y\\":0.825},{\\"type\\":2,\\"lt_x\\":0.612,\\"lt_y\\":0.911,\\"rb_x\\":0.988,\\"rb_y\\":0.984}]}}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_logo_erase",
"als_filter": {
"active_areas": [
{
"type": 2,//字幕文字去除,type设置为2
"lt_x": 0.106,
"lt_y": 0.733,
"rb_x": 0.901,
"rb_y": 0.824
},
{
"type": 2,//字幕文字去除,type设置为2
"lt_x": 0.612,
"lt_y": 0.911,
"rb_x": 0.988,
"rb_y": 0.984
}
]
}
}
}
对于非常见互联网 Logo,一般不在模型库中,可按以下两种情况处理:
Logo 位置动态变化:需通过训练模型实现擦除,此过程将额外收取模型训练费用。
Logo 位置固定:可通过 custom_objs 直接指定擦除区域,完成去除,无需额外模型训练费用。示例如下:
转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_logo_erase\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"cluster_id": "gpu_zhiyan",
"CustomerAppId": "subtitle_logo_erase",
"custom_objs": {
"type": 0,
"time_objs": [
{
"objs": [
{
"type": 1,//水印去除,type设置为1
"value": "customobjs",
"score": 100,
"rect": {
"lt_x": 0.024,
"lt_y": 0.027,
"rb_x": 0.14,
"rb_y": 0.198
}
}
]
}
]
}
}
}

六、隐私保护处理(人脸车牌)

计费说明

使用隐私保护处理功能,收取“隐私保护处理(人脸、车牌)”费用,定价请参考 智能擦除计费说明

6.1 人脸处理

识别视频画面后,对出现的人脸进行模糊或马赛克处理,并生成新的视频。
模糊效果
左图:原始视频画面;右图:人脸模糊处理
左图:原始视频画面;右图:人脸模糊处理

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_blur\\"}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"CustomerAppId": "facial_mosaic"
}
}

6.2 人脸和车牌同时处理

识别视频画面后,对出现的人脸和车牌信息同时进行模糊或马赛克处理,并生成新的视频。
模糊效果
内测中,如需测试体验,您可以 联系我们 获得支持。
马赛克效果
左图:原始视频画面;右图:人脸&车牌均被打上马赛克
左图:原始视频画面;右图:人脸&车牌均被打上马赛克

转义后的字符串
未转义 JSON
ExtendedParameter 传入以下转义后字符串(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_and_numberplate_mosaic_v2\\"}}
ExtendedParameter 传入以下未转义 JSON(字段具体说明请参考 附:ExtendedParameter 字段说明)。
{
"delogo": {
"CustomerAppId": "facial_and_numberplate_mosaic_v2"
}
}

附:ExtendedParameter 字段说明

ExtendedParameter 支持的所有字段及其说明如下:

"delogo":{
"CustomerAppId": "subtitle_extract", # string;预设场景参数,不同场景可能只用到以下部分参数,一般参数修改需要我们内部确认。
"cluster_id": "", # string;保留字段,用于策略进行集群调度,特定任务需要在特定集群跑,不能随便修改
"output_patten": "{task_type}-{session_id}", # string;输出文件名,不能有特殊字符,长度小于 200,标识 {},支持占位符 task_type、session_id
"als_filter": { # json对象;目标检查分析过滤器
"min_ocr_height": 10, # float,大于等于 0 有效;对于文字识别:文字最小大小。注:小于等于 1 表示视频高度比例,大于 1 表示像素
"max_ocr_height": 0.06, # float,大于等于 0 有效;对于文字识别:文字最大大小
"active_areas": [ # json 数组;区域过滤,识别结果中心点在该区域内,才采用
{
"lt_x": 0.1, # float,大于等于 0 有效;区域左上角x坐标。注:小于等于 1 表示比例,大于 1 表示像素
"lt_y": 0.6, # float,大于等于 0 有效;区域左上角y坐标
"rb_x": 0.9, # float,大于等于 0 有效;区域右下角x坐标
"rb_y": 0.95 # float,大于等于 0 有效;区域右下角y坐标
}
]
},
"custom_objs": { # json 对象;自定义区域
"type": 0, # int,填0;指定类型
"time_objs": [# json 数组;时间区域信息
{
"begin_ms": 0, # int;起始时间,单位ms,不填同视频开始
"end_ms": 100, # int;结束时间,单位ms,不填同视频结尾
"objs": [ # json 数组;区域信息
{
"rect": { # json对象;目标区域
"lt_x": 55, # float,大于等于 0 有效;区域左上角x坐标。注:小于 1 表示比例,大于等于 1 表示像素
"lt_y": 143, # float,大于等于 0 有效;区域左上角y坐标
"rb_x": 327, # float,大于等于 0 有效;区域右下角x坐标
"rb_y": 192 # float,大于等于 0 有效;区域右下角y坐标
},
"score": 100, # int,此处填100;目标参考分值
"type": 2, # int;目标类型,1Logo等目标, 2 指文字
"value": "LUSN" # string;目标取值,例如文字识别则填对应的文字
}
]
}
]
}
"subtitle_param" : { # json对象;字幕相关参数
"margin_bottom": 0.2, # float,大于等于 0 有效;用于字幕文件渲染,字幕距离底边距离,小于等于 1 表示视频高度比例, 大于 1 表示像素;
"font_size": 50, # float,大于等于 0 有效;用于字幕文件渲染,字幕渲染字体大小,小于等于 1 表示视频高度比例, 大于 1 表示像素;
"font_type": "simkai", # string;字幕渲染字体:simkai-楷体,hei-黑体,song-宋体;
"translate_dst_language": "en" # string;用于字幕翻译,设置为空,则不进行翻译,只输出原始字幕;其他值对应关系为: en-英语、zh-中文、ja-日语、ko-韩语、de-德语、pt-葡萄牙语、id-印尼语、th-泰语、ms-马来语;以上仅列出常用语种,我们支持上百种翻译语种,如有需求请联系我们获取完整列表。
}
}