智能横转竖和竖转横接入

最近更新时间:2026-04-30 11:47:31

我的收藏

功能介绍

能力
能力说明
处理示例
计费说明
智能横转竖-基础版
通过识别感兴趣区域 (ROI,Region of Interest),将现有的横屏视频裁剪成一定比例、适合移动设备播放的竖屏视频。
转竖屏时会跟随 ROI 区域(针对赛事视频,一般为球所在的位置)智能裁剪

收取“智能横转竖”费用,定价请参考 计费说明文档
AIGC 横转竖、竖转横
基于 AIGC 算法,对原视频进行 AI 生成处理,可将横屏视频补全为竖屏,或将竖屏视频补全为横屏。


收取“智能横转竖-高级版”费用,定价请参考 计费说明文档

前置操作

在接入前,您需要在 云点播控制台媒体处理 > 媒体处理模板 > 媒体智能模板页面中开通 MPS 服务。
注意:
智能横转竖和竖转横功能由媒体处理(MPS)提供服务,使用前需同时开通 VOD 和 MPS 服务
功能用量及账单将在媒体处理(MPS)平台显示。定价请参考 MPS 媒体 AI 按量计费


方式一、控制台使用

发起任务

您可以进入 云点播控制台 智能媒资管理 > 音视频管理页面发起任务。
1. 选择需要发起任务的视频,并单击媒体处理

2. 处理类型选择“媒体智能”的智能分析,您可以选择28号预设模板,根据下文 扩展参数说明,传入所需参数发起任务。
说明:
控制台会自动转义,请直接传入 JSON 数据,不要传入转义后的字符串,否则会导致任务失败。


查看任务结果

云点播控制台 任务中心页面,找到对应任务并单击详情查看结果。

您也可以调用 DescribeMediaInfos 接口,查询存入媒资的结果。
注意:
同一模板任务,媒资中仅保留最新的任务结果。

方式二、API 接入

发起任务

调用 ProcessMediaByMPS,FileId 处填写需要处理的媒资 ID,SubAppId 处填入子应用 ID,MPSProcessMediaParams 参数中填写 AiAnalysisTask 任务,并将 Definition 设置为 28(预置模板)。ExtendedParameter 根据需求填额外的扩展参数,通过该参数实现特定的能力。
任务 MPSProcessMediaParams 参数示例如下:
{"AiAnalysisTask":{"Definition":28,"ExtendedParameter":"{\\"htv\\":{\\"AlgorithmType\\":2,\\"SmoothWeight\\":0.75,\\"Ratio\\":\\"9:16\\"}}"}}


查询任务结果

可以在输出信息中找到输出文件路径。


扩展参数说明

扩展参数可以实现特定的能力。由于媒体处理接口无法解析扩展参数,因此 ExtendedParameter 的值为序列化的 JSON 字符串。以下是一个序列化前的 json 示例,使用 API 时请注意传入转义后的参数:
{
"htv": {
"AlgorithmType": 2,
"SmoothWeight": 0.75,
"Ratio": "9:16"
}
}

// 直接调用API时需传入转义后参数: {\\"htv\\": {\\"AlgorithmType\\": 2, \\"SmoothWeight\\": 0.75, \\"Ratio\\": \\"9:16\\" }}
名称
类型
描述
AlgorithmType
Integer
指定算法类别:
2:支持多种模型的算法和定制优化。
3:使用精确的人脸检测算法,两个人脸出现时,上下分割显示人脸,尽可能将人脸居中显示。
5:直接缩放视频,居中放在竖屏。使用毛玻璃模糊处理后的图片作为背景。
6:AIGC 模式,基于原有的横屏视频补全到 9:16 的竖屏。
7:AIGC 模式,基于原有的竖屏视频补全到 16:9 的横屏。
Ratio
String
视频横竖比,字符串类型,内部进行解析。如果解析失败会取默认值 9:16 的比例进行裁剪。(例如:"9:16",转换成横比竖 9:16 视频,高度取原视频高度)
FaceDetectConfig
Object
人脸检测相关配置。
OutputPattern
String
用于自定义文件名, timestamp, sessionId 为可用替换参数。
例如:"htv-{sessionId}-{timestamp}",则输出文件命名为 htv-xxxx-202412250000,其中 xxxx 是任务的真实 sessionId。
如不指定,默认输出文件名为 "htv-{sessionId}"。
BlurWeight
Integer
模糊参数,数值越大模糊效果越强。参数数值过大会影响处理速度。
SmoothWeight
Float
0-1 之间的浮点数,控制平滑速度参数。数值越小镜头移动越快。
FaceDetectConfig
名称
类型
描述
FaceScoreThd
Integer
人脸检测算法的识别阈值,仅当人脸识别评分超过该阈值时,才将其视为有效的人脸。
FaceAccuracy
String
可选,人脸检测算法执行次数,默认使用 Balance,其他可选项 Efficiency,Precision。
FallbackConfig
Object
人脸检测的兜底策略,包括无人脸,两个人脸的兜底策略。
FallbackConfig
名称
类型
描述
NoFaceDetect
String
可选值:Scale,ScaleWithoutBlur。默认值 ScaleWithoutBlur。
DoubleFace
String
可选值:Scale,ScaleWithoutBlur,SplitScreenVertical。默认值 SplitScreenVertical。
Scale:缩放居中该帧,背景使用毛玻璃效果处理后的图片替换。
ScaleWithoutBlur:缩放居中该帧,背景使用纯黑替换。
SplitScreenVertical:双人脸默认处理逻辑,上下分屏,两个人脸居中放在上下两个区域。