智能擦除功能简介
智能擦除能够对视频画面中的 Logo、字幕、人脸和车牌等元素进行模糊、马赛克或无痕化处理,从而便于内容的传播和分享。该功能广泛应用于短剧平台、短视频平台、跨境电商以及自媒体工作室等多个领域。
前置操作

使用方式
方式一、控制台使用
发起任务
1. 选择需要发起任务的视频,并单击媒体处理。

2. 处理类型选择“媒体智能”的智能分析,选择25号预设模板。开启更多设置的扩展参数,参考下文 扩展参数说明,传入所需参数。
说明:
25号预设模板默认为智能擦除-去水印基础版功能。如需发起视频译制任务,必须传入扩展参数,否则仅对视频进行去水印处理。
控制台会自动转义,请直接传入 JSON 数据,不要传入转义后的字符串,否则会导致任务失败。

查看任务结果
1. 在 云点播控制台 的任务中心页面,找到对应任务并单击详情查看结果。


2. 生成结果将作为新的视频存储在 VOD,您可以在控制台查看生成结果。

方式二、API 接入
发起任务
调用 ProcessMediaByMPS,FileID 填写需要处理的媒资 ID, SubAppID 填入子应用 ID, MPSProcessMediaParams 参数中, 填写 AiAnalysisTask 任务,并将 Definition 设置为 25(预置模板)。ExtendedParameter 根据需求填额外的扩展参数,通过该参数实现特定的能力。
智能擦除任务 MPSProcessMediaParams 参数示例如下:
{"AiAnalysisTask":{"Definition":25,"ExtendedParameter":"{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\"}}"}}

查询任务结果

分场景 ExtendedParameter 传参示例
智能擦除最常用的原子能力为去字幕,为支持短剧出海、视频转译等业务,还支持在去字幕的同时进行:
OCR 提取字幕并翻译:将字幕提取出来并进行翻译,生成翻译语言字幕文件。
音频合成:输入去字幕后的无痕视频,以及校准后的翻译语言字幕文件,生成带有翻译语言配音的新视频。
字幕压制:将字幕压制到视频画面中。
除此之外,智能擦除还支持:
去 Logo:去除视频上的 Logo。
隐私保护处理:将人脸、车牌进行模糊或马赛克处理。
使用不同能力,可以参考下文介绍,传入对应的 ExtendedParameter。
一、去字幕
计费说明
1.1 去字幕(自动擦除)
去字幕(自动擦除)指通过 AI 模型自动识别视频中的字幕文本内容,进行无痕化擦除,生成新的视频。画面干扰、特殊字幕样式可能会带来一定漏擦、误擦问题,您可以通过去字幕(指定区域擦除)处理。
使用去字幕(自动擦除)能力,ExtendedParameter 基础传参如下:
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\"}}
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_erase_fast"}}
指定字幕大致位置,保护无需擦除的视频区域
去字幕功能默认会自动识别视频画面中部靠下的文字区域,并对这些文字区域进行擦除。
若您的视频类似下方示例,中部靠下部分有其他无需擦除的文字内容,您可以通过
als_filter 参数指定字幕的大致位置来减少误擦问题。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"als_filter\\":{\\"active_areas\\":[{\\"lt_x\\":0.097,\\"lt_y\\":0.626,\\"rb_x\\":0.928,\\"rb_y\\":0.705}]}}}/*als_filter: 自动擦除区域,用于指定字幕的大致位置来减少画面干扰造成的误擦问题。(lt_x,lt_y)为区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:[ 0, 1 ] :表示占视频宽或高的比例( 1, + ) :表示像素*/
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_erase_fast","als_filter": {"active_areas": [{"lt_x": 0.097,"lt_y": 0.626,"rb_x": 0.928,"rb_y": 0.705}]}}}
若您希望自动擦除全屏文字内容,则可以将
als_filter 的区域大小尽量设为视频全屏大小,参考如下:{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"als_filter\\":{\\"active_areas\\":[{\\"lt_x\\":0,\\"lt_y\\":0,\\"rb_x\\":0.9999,\\"rb_y\\":0.9999}]}}}/*als_filter: 自动擦除区域,用于指定字幕的大致位置来减少画面干扰造成的误擦问题。(lt_x,lt_y)为区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:[ 0, 1 ] :表示占视频宽或高的比例( 1, + ) :表示像素*/
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_erase_fast","als_filter": {"active_areas": [{"lt_x": 0,"lt_y": 0,"rb_x": 0.9999,"rb_y": 0.9999}]}}}
1.2 去字幕(指定区域擦除)
去字幕(自动擦除)通常能自动识别出较准确的字幕位置,但在某些特殊情况下可能会出现漏擦问题,例如下图情况:

因此,若您的字幕位置较固定,建议您通过
custom_objs 直接指定擦除区域,最大程度减少漏擦的情况。说明:
指定
custom_objs 后,系统将直接擦除所选区域,不会自动识别或擦除视频中其他位置的文字内容。因此,请完整传入目标擦除区域。示例:

{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_fast\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":53,\\"lt_y\\":228,\\"rb_x\\":137,\\"rb_y\\":644}}]}]}}}/*您可以指定多个擦除区域(不建议超过10个)。(lt_x,lt_y)为擦除区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:[ 0, 1 ) :表示占视频宽/高的比例[ 1, + ) :表示像素*/
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_erase_fast","custom_objs": {"type": 0,"time_objs": [{"objs": [{"type": 2,"score": 100,"rect": {"lt_x": 53,"lt_y": 228,"rb_x": 137,"rb_y": 644}}]}]}}}
1.3 针对特殊样式字幕
去字幕提供两种模型版本,适用于不同的字幕样式:
标准版(推荐):通常建议选择该版本,适用于字幕样式标准的视频,无痕化效果更好,细节还原更优。
CustomerAppId 传入 subtitle_erase_fast,表示使用“标准版”。
区域版:适用于特殊样式字幕(如背景阴影、花体、动效),擦除面积更大,但无痕效果不如标准版。
指定“区域版”,
CustomerAppId 传入 subtitle_erase_area。示例:
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_area\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":879,\\"lt_y\\":169,\\"rb_x\\":997,\\"rb_y\\":761}}]}]}}}/*subtitle_erase_area,表示使用“区域版”去字幕模型,适用于特殊样式字幕。您可以指定多个擦除区域(不建议超过10个)。(lt_x,lt_y)为擦除区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:[ 0, 1 ) :表示占视频宽或高的比例[ 1, + ) :表示像素*/
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_erase_area","custom_objs": {"type": 0,"time_objs": [{"objs": [{"type": 2,"score": 100,"rect": {"lt_x": 879,"lt_y": 169,"rb_x": 997,"rb_y": 761}}]}]}}}
1.4 字幕漏擦区域二次处理
如果使用去字幕(自动擦除)处理后,还有一些漏擦区域,通常是字幕样式、视频背景等造成的影响。您可以将去字幕模型改为“区域版”(
subtitle_erase_area),并通过 custom_objs 指定漏擦区域位置来进行修复。您还可以通过 begin_ms、end_ms 字段指定需二次处理的时间段。注意,为保证修复效果,漏擦区域位置、时间段需尽量准确。说明:
由于去字幕输出视频需要为完整视频进行编解码,因此按输出视频的总时长计费,而不是按
begin_ms 和 end_ms 字段指定的擦除处理时间段计费。{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_area\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"begin_ms\\":3000,\\"end_ms\\":5000,\\"objs\\":[{\\"type\\":2,\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.0,\\"lt_y\\":10,\\"rb_x\\":10,\\"rb_y\\":20}}]}]}}}
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_erase_area","custom_objs": {"type": 0,"time_objs": [{"begin_ms": 3000,"end_ms": 5000,"objs": [{"type": 2,"score": 100,"rect": {"lt_x": 0.0,"lt_y": 10,"rb_x": 10,"rb_y": 20}}]}]}}}
二、配音级译制(同时去字幕 + OCR 提取字幕 + 翻译字幕 + 字幕压制 + AI 配音)

三、字幕级译制(同时去字幕 + OCR 提取字幕 + 翻译字幕 + 字幕压制)
输入带有原语言字幕的视频,输出带有翻译语言字幕的视频(不含 AI 配音)。

计费说明
示例如下:
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_erase_and_translate\\",\\"subtitle_param\\":{\\"translate_dst_language\\":\\"en\\"}}}
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_erase_and_translate","subtitle_param": {"translate_dst_language": "en"}}}
四、去 Logo
去 Logo 表示擦除视频画面中的 Logo、图标、用户头像等图形内容,支持基础版和高级版两种模式:
基础版:基础模糊效果,性价比高,适合动画或背景较干净的视频。收取“智能擦除基础费用(去 Logo-基础版)”费用。
高级版:擦除效果更好,适合短剧等现实风格视频。收取“去 Logo-高级版”费用。

4.1 去 Logo 高级版
相比去 Logo 基础版,高级版擦除效果更好。
CustomerAppId 传入 ai_delogo_v1 表示使用去 Logo 高级版。支持自动擦除和指定区域擦除两种处理方式:
自动擦除:利用 AI 模型,自动识别视频全屏画面中的 Logo 并进行擦除,支持静态和位置变化的 Logo。
目前,我们支持十多种常见互联网 Logo,对于不在支持范围内的 Logo,我们也提供定制化训练服务,这将单独收取模型训练费用。
画面干扰可能会给自动擦除带来负面影响,造成一定漏擦误擦,这种情况可以通过指定区域擦除进行二次修复。
指定区域擦除:对于位置固定的静态 Logo,建议使用指定区域擦除,减少漏擦误擦问题。

计费说明
4.1.1 自动擦除

{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\"}}
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "ai_delogo_v1"}}
4.1.2 自动擦除基础上,指定需擦除的 Logo 位置,保护无需擦除的区域
自动擦除功能默认会去除全局识别到的 Logo。如果传入
als_filter,可以指定 Logo 的大致位置,系统在自动擦除时将过滤掉该区域外的 Logo,从而保护不需要擦除的视频部分。
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\",\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":1,\\"lt_x\\":527,\\"lt_y\\":13,\\"rb_x\\":701,\\"rb_y\\":78}]}}}/*als_filter: 自动提取区域,用于指定字幕的大致位置来减少误检问题。(lt_x,lt_y)为区域的左上点的坐标,(rb_x,rb_y)为区域右下点的坐标。其坐标值:[ 0, 1 ] :表示占视频宽或高的比例( 1, + ) :表示像素*/
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "ai_delogo_v1","als_filter": {"active_areas": [{"type": 1,"lt_x": 527,"lt_y": 13,"rb_x": 701,"rb_y": 78}]}}}
4.1.3 指定区域擦除
自动擦除只支持处理 MPS 模型库内的 Logo。对于非常见互联网 Logo,一般不在 MPS 模型库中,可按以下两种情况处理:
Logo 位置动态变化:需通过训练模型实现擦除,此过程将额外收取模型训练费用。
Logo 位置固定:可通过
custom_objs 直接指定擦除区域,完成去除,无需额外模型训练费用。示例如下:
{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"ai_delogo_v1\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "ai_delogo_v1","custom_objs": {"type": 0,"time_objs": [{"objs": [{"type": 1,//水印去除,type设置为1"value": "customobjs","score": 100,"rect": {"lt_x": 0.024,"lt_y": 0.027,"rb_x": 0.14,"rb_y": 0.198}}]}]}}}
4.2 去 Logo 基础版
去 Logo 基础版为模糊擦除效果,也支持自动擦除和指定区域擦除两种使用方式。
计费说明
4.2.1 自动擦除
若 ExtendedParameter 不填,则为去 Logo 基础版(自动擦除)场景,全屏识别 Logo。

ExtendedParameter 不传即可。
ExtendedParameter 不传即可。
4.2.2 指定区域擦除
同去 Logo 高级版,基础版自动擦除也只支持处理 MPS 模型库内的 Logo。对于非常见互联网 Logo,一般不在 MPS 模型库中,可按以下两种情况处理:
Logo 位置动态变化:需通过训练模型实现擦除,此过程将额外收取模型训练费用。
Logo 位置固定:可通过
custom_objs 直接指定擦除区域,完成去除,无需额外模型训练费用。示例如下:{\\"delogo\\":{\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
{"delogo": {"custom_objs": {"type": 0,"time_objs": [{"objs": [{"type": 1,//水印去除,type设置为1"value": "customobjs","score": 100,"rect": {"lt_x": 0.024,"lt_y": 0.027,"rb_x": 0.14,"rb_y": 0.198}}]}]}}}
五、同时去字幕 + 去 Logo
计费说明
操作指引
当视频中同时存在字幕(文字内容)和 Logo(图形内容)时,可以将
CustomerAppId 指定为 subtitle_logo_erase,同时进行去字幕和去 Logo 处理。对于常见互联网 Logo,您无需指定 Logo 位置,系统会自动擦除,只需通过 als_filter 指定字幕所在位置。

{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_logo_erase\\",\\"als_filter\\":{\\"active_areas\\":[{\\"type\\":2,\\"lt_x\\":0.106,\\"lt_y\\":0.733,\\"rb_x\\":0.901,\\"rb_y\\":0.825},{\\"type\\":2,\\"lt_x\\":0.612,\\"lt_y\\":0.911,\\"rb_x\\":0.988,\\"rb_y\\":0.984}]}}}
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_logo_erase","als_filter": {"active_areas": [{"type": 2,//字幕文字去除,type设置为2"lt_x": 0.106,"lt_y": 0.733,"rb_x": 0.901,"rb_y": 0.824},{"type": 2,//字幕文字去除,type设置为2"lt_x": 0.612,"lt_y": 0.911,"rb_x": 0.988,"rb_y": 0.984}]}}}
对于非常见互联网 Logo,一般不在模型库中,可按以下两种情况处理:
Logo 位置动态变化:需通过训练模型实现擦除,此过程将额外收取模型训练费用。
Logo 位置固定:可通过
custom_objs 直接指定擦除区域,完成去除,无需额外模型训练费用。示例如下:{\\"delogo\\":{\\"cluster_id\\":\\"gpu_zhiyan\\",\\"CustomerAppId\\":\\"subtitle_logo_erase\\",\\"custom_objs\\":{\\"type\\":0,\\"time_objs\\":[{\\"objs\\":[{\\"type\\":1,\\"value\\":\\"customobjs\\",\\"score\\":100,\\"rect\\":{\\"lt_x\\":0.024,\\"lt_y\\":0.027,\\"rb_x\\":0.14,\\"rb_y\\":0.198}}]}]}}}
{"delogo": {"cluster_id": "gpu_zhiyan","CustomerAppId": "subtitle_logo_erase","custom_objs": {"type": 0,"time_objs": [{"objs": [{"type": 1,//水印去除,type设置为1"value": "customobjs","score": 100,"rect": {"lt_x": 0.024,"lt_y": 0.027,"rb_x": 0.14,"rb_y": 0.198}}]}]}}}
六、隐私保护处理(人脸车牌)
计费说明
6.1 人脸处理
识别视频画面后,对出现的人脸进行模糊或马赛克处理,并生成新的视频。
模糊效果

{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_blur\\"}
{"delogo": {"CustomerAppId": "facial_mosaic"}}
6.2 人脸和车牌同时处理
识别视频画面后,对出现的人脸和车牌信息同时进行模糊或马赛克处理,并生成新的视频。
模糊效果
马赛克效果

{\\"delogo\\":{\\"CustomerAppId\\":\\"facial_and_numberplate_mosaic_v2\\"}}
{"delogo": {"CustomerAppId": "facial_and_numberplate_mosaic_v2"}}
附:ExtendedParameter 字段说明
ExtendedParameter 支持的所有字段及其说明如下:
"delogo":{"CustomerAppId": "subtitle_extract", # string;预设场景参数,不同场景可能只用到以下部分参数,一般参数修改需要我们内部确认。"cluster_id": "", # string;保留字段,用于策略进行集群调度,特定任务需要在特定集群跑,不能随便修改"output_patten": "{task_type}-{session_id}", # string;输出文件名,不能有特殊字符,长度小于 200,标识 {},支持占位符 task_type、session_id"als_filter": { # json对象;目标检查分析过滤器"min_ocr_height": 10, # float,大于等于 0 有效;对于文字识别:文字最小大小。注:小于等于 1 表示视频高度比例,大于 1 表示像素"max_ocr_height": 0.06, # float,大于等于 0 有效;对于文字识别:文字最大大小"active_areas": [ # json 数组;区域过滤,识别结果中心点在该区域内,才采用{"lt_x": 0.1, # float,大于等于 0 有效;区域左上角x坐标。注:小于等于 1 表示比例,大于 1 表示像素"lt_y": 0.6, # float,大于等于 0 有效;区域左上角y坐标"rb_x": 0.9, # float,大于等于 0 有效;区域右下角x坐标"rb_y": 0.95 # float,大于等于 0 有效;区域右下角y坐标}]},"custom_objs": { # json 对象;自定义区域"type": 0, # int,填0;指定类型"time_objs": [# json 数组;时间区域信息{"begin_ms": 0, # int;起始时间,单位ms,不填同视频开始"end_ms": 100, # int;结束时间,单位ms,不填同视频结尾"objs": [ # json 数组;区域信息{"rect": { # json对象;目标区域"lt_x": 55, # float,大于等于 0 有效;区域左上角x坐标。注:小于 1 表示比例,大于等于 1 表示像素"lt_y": 143, # float,大于等于 0 有效;区域左上角y坐标"rb_x": 327, # float,大于等于 0 有效;区域右下角x坐标"rb_y": 192 # float,大于等于 0 有效;区域右下角y坐标},"score": 100, # int,此处填100;目标参考分值"type": 2, # int;目标类型,1 指Logo等目标, 2 指文字"value": "LUSN" # string;目标取值,例如文字识别则填对应的文字}]}]}"subtitle_param" : { # json对象;字幕相关参数"margin_bottom": 0.2, # float,大于等于 0 有效;用于字幕文件渲染,字幕距离底边距离,小于等于 1 表示视频高度比例, 大于 1 表示像素;"font_size": 50, # float,大于等于 0 有效;用于字幕文件渲染,字幕渲染字体大小,小于等于 1 表示视频高度比例, 大于 1 表示像素;"font_type": "simkai", # string;字幕渲染字体:simkai-楷体,hei-黑体,song-宋体;"translate_dst_language": "en" # string;用于字幕翻译,设置为空,则不进行翻译,只输出原始字幕;其他值对应关系为: en-英语、zh-中文、ja-日语、ko-韩语、de-德语、pt-葡萄牙语、id-印尼语、th-泰语、ms-马来语;以上仅列出常用语种,我们支持上百种翻译语种,如有需求请联系我们获取完整列表。}}