产品功能

最近更新时间:2025-01-15 14:28:32

我的收藏
说明:
自2025年起,原 “智能编辑” 产品已更名为“媒体 AI”,且控制台相关功能迁移至父产品“媒体处理”中,媒体 AI 控制台(原“智能编辑”控制台)不再迭代使用。请前往 媒体处理控制台 使用智能字幕、智能擦除、智能横转竖、大模型视频摘要等媒体AI功能,相关文档请参见 媒体处理文档指引

热门功能介绍

随着AI大模型的不断发展,大模型技术掀起的浪潮席卷了政务、医疗、教育等社会各个领域。基于业界领先的音视频编解码算法基础,腾讯云媒体处理也在大模型领域也升级了许多新玩法,全新媒体 AI 方案支持了智能字幕、智能擦除、大模型视频摘要、智能横转竖等增值创新能力。通过长期的大模型算法优化及业务数据集积累,媒体 AI 在模型多样性、处理结果准确度、产品易用性等方面都取得了新的技术突破,成功支持了一系列头部客户,树立了业界技术标杆。

智能字幕

智能字幕功能可以将点播视频文件或直播流中的语音信息进行实时语音识别,将其转换成字幕并进行多语言翻译,适用于直播实时字幕、视频转译出海等场景。也支持通过文字识别提取视频画面中的原有字幕并生成字幕文件,适用于老片修复、高清重制等场景。该功能还支持配置热词库、术语库以增加识别和翻译的准确率。查看 智能字幕接入指引

技术优势

全平台支持:支持处理点播文件、直播流、互动音视频。直播实时同传字幕支持稳态、渐变模式,接入门槛低,无需播放端改造。
准确率高:大模型处理,支持热词、术语库,准确率行业领先。
语种丰富:支持上百种语种,支持多地方言,支持中英文夹杂等混合语种识别。
样式自定义:支持将字幕压制至视频,且字幕样式(字体、字号、颜色、背景、位置等)可自定义,支持页面自定义渲染。




智能擦除

智能擦除能够对视频画面中的字幕、人脸和车牌等元素进行模糊、马赛克或无痕化处理,从而便于内容的传播和分享。该功能广泛应用于短剧平台、短视频平台、跨境电商以及自媒体工作室等多个领域。查看 智能擦除接入指引
高可定制性:支持针对您的具体的视频场景,对模型参数进行定制化调整,从而提高擦除的准确率和处理效果,确保最终呈现的画面更加自然流畅。


高光集锦

高光集锦定义了精彩场景对应的关键词,例如“男女主角冲突”或“精彩打斗戏”。通过将图像特征和文本特征映射到一个统一的特征空间,我们可以利用这些关键词精准地找到视频中的精彩场景,从而提取出最引人注目的片段。支持影视剧、足球、篮球、绝地求生、王者荣耀等视频场景,支持定制(视频智能服务官方 QQ:303224607,需支付定制费)。查看 高光集锦接入指引

技术优势

全平台支持:支持处理点播离线视频,也支持对直播流进行处理,实现对过往的直播内容生成精彩片段。
多场景支持:支持影视剧、体育赛事、游戏竞赛、新闻资讯等视频场景。
高可定制性:支持针对您的具体的视频场景,对模型参数进行定制化调优。




智能拆条

智能拆条功能可以对视频内容进行结构化分析,将完整的长视频进行分段处理。例如,将一段新闻联播的素材拆分成多个独立的新闻事件视频。这可以显著提升新闻和体育类视频的拆条质量,促进二次创作,节省人力和硬件成本。查看 智能拆条接入指引




大模型视频摘要

借助NLP能力,大模型视频摘要功能可以对教学课程、新闻、演讲等视频场景,基于ASR识别结果进行混元大模型摘要提取。其提取和概括力强,无需反复拖拽即可快速理解视频内容。同时还支持离线分段和直播实时分段,自动提取段落摘要及关键词,帮助用户快速定位感兴趣的视频片段,提高使用效率。查看 大模型视频摘要接入指引

技术优势

全平台支持:支持处理点播离线视频,也支持对直播流进行处理。
多语种支持:支持中文、英文等语种。




智能横转竖

横转竖不是单纯的旋转,而是通过识别感兴趣区域 (ROI,Region of Interest),将视频裁剪成一定比例的适合移动设备播放的视频。横转竖提供批量生成短视频的能力,能够将现有的横屏视频资源转换成竖屏视频资源。查看智能横转竖接入指引

技术优势

支持多人物场景:当视频中出现两个人物时,支持自动将画面上下分割,并在竖屏视频中分别显示这两个人物。
高可定制性:支持针对您的具体的视频场景,对模型参数进行定制化调优。




ROI 智能识别

ROI 智能识别技术可以实时识别视频中的人脸、游戏人物、主播等关键元素的坐标信息,并将感兴趣区域信息(ROI)随着视频编码传输到播放端。通过播放器结合 ROI 信息,可以实现智能弹幕防遮挡、背景模糊等功能。当前 ROI 智能识别支持处理直播流,如有处理离线视频的需求,请联系我们。查看直播ROI智能识别接入指引




智能封面

结合视频画面纹理、场景识别等特征信息自动生成文件封面,支持静态封面输出,提升视频封面体验和点击转化率。

视频标签识别

基于腾讯深度学习方案,智能识别出最符合视频内容的前五项标签摘要,用于视频推荐、检索等场景,用户可在接口中自行选择返回的标签个数。

片头片尾识别

根据视频画面特征、文字、语音等信息,自动识别定位电影、电视剧片头片尾时间点。

分类识别

通过分析视频内容,给视频推荐一个类别。目前支持美食、旅游、动漫、音乐等19大类,支持定制(视频智能服务官方 QQ:303224607,需支付定制费)。

媒体质检

支持检测直播、点播视频中的画面帧以及声音质量,涵盖花屏、黑边、马赛克、噪声等全方位13项检测类型,并提供主播视频整体质量检测评分,辅助推荐更精准。

画质重生

视频超分通过画质修复和画质增强两大模块结合 AI 算法,提升分辨率的同时,能够提供视频去噪、轮廓修复、超分辨重建等功能,适用于 UGC/PGC 视频质量提升, 老片翻新,4K 生产等业务场景。