云点播智能横转竖和竖转横接入

功能介绍
能力
能力说明
处理示例
计费说明
智能横转竖-基础版
通过识别感兴趣区域 （ROI，Region of Interest），将现有的横屏视频裁剪成一定比例、适合移动设备播放的竖屏视频。
转竖屏时会跟随 ROI 区域（针对赛事视频，一般为球所在的位置）智能裁剪
﻿
收取“智能横转竖”费用，定价请参考 计费说明文档。
AIGC 横转竖、竖转横
基于 AIGC 算法，对原视频进行 AI 生成处理，可将横屏视频补全为竖屏，或将竖屏视频补全为横屏。
﻿单击查看示例视频﻿
﻿
﻿
收取“智能横转竖-高级版”费用，定价请参考 计费说明文档。
前置操作
在接入前，您需要在 云点播控制台 的媒体处理 > 媒体处理模板 > 媒体智能模板页面中开通 MPS 服务。
注意：
智能横转竖和竖转横功能由媒体处理（MPS）提供服务，使用前需同时开通 VOD 和 MPS 服务。
功能用量及账单将在媒体处理（MPS）平台显示。定价请参考 MPS 媒体 AI 按量计费。
﻿
方式一、控制台使用
发起任务
您可以进入 云点播控制台 的智能媒资管理 > 音视频管理页面发起任务。
1. 选择需要发起任务的视频，并单击媒体处理。
﻿
2. 处理类型选择“媒体智能”的智能分析，您可以选择28号预设模板，根据下文 扩展参数说明，传入所需参数发起任务。
说明：
控制台会自动转义，请直接传入 JSON 数据，不要传入转义后的字符串，否则会导致任务失败。
﻿
查看任务结果
在 云点播控制台 的任务中心页面，找到对应任务并单击详情查看结果。
﻿
您也可以调用 DescribeMediaInfos 接口，查询存入媒资的结果。
注意：
同一模板任务，媒资中仅保留最新的任务结果。
方式二、API 接入
发起任务
调用 ProcessMediaByMPS，FileId 处填写需要处理的媒资 ID，SubAppId 处填入子应用 ID，MPSProcessMediaParams 参数中填写 AiAnalysisTask 任务，并将 Definition 设置为 28（预置模板）。ExtendedParameter 根据需求填额外的扩展参数，通过该参数实现特定的能力。
任务 MPSProcessMediaParams 参数示例如下：
{"AiAnalysisTask":{"Definition":28,"ExtendedParameter":"{\\"htv\\":{\\"AlgorithmType\\":2,\\"SmoothWeight\\":0.75,\\"Ratio\\":\\"9:16\\"}}"}}
﻿
查询任务结果
使用 云点播查询任务详情 或 云点播获取任务列表 查询任务。
可以在输出信息中找到输出文件路径。
﻿
扩展参数说明
扩展参数可以实现特定的能力。由于媒体处理接口无法解析扩展参数，因此 ExtendedParameter 的值为序列化的 JSON 字符串。以下是一个序列化前的 json 示例，使用 API 时请注意传入转义后的参数：
{
    "htv": {
      "AlgorithmType": 2,	
      "SmoothWeight":  0.75,
      "Ratio": "9:16"
    }
}
﻿
// 直接调用API时需传入转义后参数： {\\"htv\\": {\\"AlgorithmType\\": 2, \\"SmoothWeight\\": 0.75, \\"Ratio\\": \\"9:16\\" }}
名称
类型
描述
AlgorithmType
Integer
指定算法类别：
2：支持多种模型的算法和定制优化。
3：使用精确的人脸检测算法，两个人脸出现时，上下分割显示人脸，尽可能将人脸居中显示。
5：直接缩放视频，居中放在竖屏。使用毛玻璃模糊处理后的图片作为背景。
6：AIGC 模式，基于原有的横屏视频补全到 9:16 的竖屏。
7：AIGC 模式，基于原有的竖屏视频补全到 16:9 的横屏。
Ratio
String
视频横竖比，字符串类型，内部进行解析。如果解析失败会取默认值 9:16 的比例进行裁剪。（例如："9:16"，转换成横比竖 9:16 视频，高度取原视频高度）
FaceDetectConfig
Object
人脸检测相关配置。
OutputPattern
String
用于自定义文件名， timestamp， sessionId 为可用替换参数。
例如："htv-{sessionId}-{timestamp}"，则输出文件命名为 htv-xxxx-202412250000，其中 xxxx 是任务的真实 sessionId。
如不指定，默认输出文件名为 "htv-{sessionId}"。
BlurWeight
Integer
模糊参数，数值越大模糊效果越强。参数数值过大会影响处理速度。
SmoothWeight
Float
0-1 之间的浮点数，控制平滑速度参数。数值越小镜头移动越快。
FaceDetectConfig
名称
类型
描述
FaceScoreThd
Integer
人脸检测算法的识别阈值，仅当人脸识别评分超过该阈值时，才将其视为有效的人脸。
FaceAccuracy
String
可选，人脸检测算法执行次数，默认使用 Balance，其他可选项 Efficiency，Precision。
FallbackConfig
Object
人脸检测的兜底策略，包括无人脸，两个人脸的兜底策略。
FallbackConfig
名称
类型
描述
NoFaceDetect
String
可选值：Scale，ScaleWithoutBlur。默认值 ScaleWithoutBlur。
DoubleFace
String
可选值：Scale，ScaleWithoutBlur，SplitScreenVertical。默认值 SplitScreenVertical。
Scale：缩放居中该帧，背景使用毛玻璃效果处理后的图片替换。
ScaleWithoutBlur：缩放居中该帧，背景使用纯黑替换。
SplitScreenVertical：双人脸默认处理逻辑，上下分屏，两个人脸居中放在上下两个区域。

能力	能力说明	处理示例	计费说明
智能横转竖-基础版	通过识别感兴趣区域（ROI，Region of Interest），将现有的横屏视频裁剪成一定比例、适合移动设备播放的竖屏视频。	转竖屏时会跟随 ROI 区域（针对赛事视频，一般为球所在的位置）智能裁剪	收取“智能横转竖”费用，定价请参考计费说明文档。
AIGC 横转竖、竖转横	基于 AIGC 算法，对原视频进行 AI 生成处理，可将横屏视频补全为竖屏，或将竖屏视频补全为横屏。	单击查看示例视频	收取“智能横转竖-高级版”费用，定价请参考计费说明文档。

名称	类型	描述
AlgorithmType	Integer	指定算法类别： 2：支持多种模型的算法和定制优化。 3：使用精确的人脸检测算法，两个人脸出现时，上下分割显示人脸，尽可能将人脸居中显示。 5：直接缩放视频，居中放在竖屏。使用毛玻璃模糊处理后的图片作为背景。 6：AIGC 模式，基于原有的横屏视频补全到 9:16 的竖屏。 7：AIGC 模式，基于原有的竖屏视频补全到 16:9 的横屏。
Ratio	String	视频横竖比，字符串类型，内部进行解析。如果解析失败会取默认值 9:16 的比例进行裁剪。（例如："9:16"，转换成横比竖 9:16 视频，高度取原视频高度）
FaceDetectConfig	Object	人脸检测相关配置。
OutputPattern	String	用于自定义文件名， timestamp， sessionId 为可用替换参数。例如："htv-{sessionId}-{timestamp}"，则输出文件命名为 htv-xxxx-202412250000，其中 xxxx 是任务的真实 sessionId。如不指定，默认输出文件名为 "htv-{sessionId}"。
BlurWeight	Integer	模糊参数，数值越大模糊效果越强。参数数值过大会影响处理速度。
SmoothWeight	Float	0-1 之间的浮点数，控制平滑速度参数。数值越小镜头移动越快。

智能横转竖和竖转横接入

本页目录：

功能介绍

前置操作

方式一、控制台使用

发起任务

查看任务结果

方式二、API 接入

发起任务

查询任务结果

扩展参数说明