技术百科

搜索技术百科

技术百科

发布

技术百科首页 >智能识别

智能识别

修改于 2023-08-31 16:14:49

10962

概述

腾讯云智能识别（Intelligent Identification，II）基于腾讯各实验室最新研究成果，为您提供视频内容的全方位识别，支持识别视频内的人物、语音、文字以及帧标签，对视频进行多维度结构化分析。

智能识别有什么产品功能？

人脸识别

基于深度学习方案，帮助客户快速识别视频中的人脸信息并快速定位出视频中的人物所在帧画面，以及人脸所在区域。客户可自定义人物库或调用视频 AI 公共人物库进行人脸识别。

语音识别

基于深度学习方案，帮助客户快速识别视频中的声音并转化成文字，支持客户自定义关键词且定位出关键词所在视频的时间点。

文字识别

帮助客户识别视频中出现的文字信息，可用于视频内自定义关键词的提取，也支持竖版文字的识别。

帧标签识别

基于深度学习方案，支持根据客户自定义视频截帧间隔，自动识别截帧画面内的标签，并定位标签所在的视频位置，帧标签涵盖人物、风景、人造物、建筑、动植物、食物等9个大类，包含日常生活的各个信息维度，并且支持在标签体系基础上使用自定义标签，具备迁移学习能力，只需提供原始用户数据便可定制分类器，满足不同类型的用户需求，使标签分类更具灵活性。

片头片尾识别

根据视频画面特征、文字、语音等信息自动识别定位电影/电视剧片头片尾时间点。

智能识别有什么产品优势？

引擎整合

基于腾讯领先的 AI 技术，并整合腾讯实验室的最新研究成果，将其应用到视频场景中，为用户提供一站式智能识别服务。

海量标签

丰富的人脸数据库、海量视频标签，涵盖人物、事件、场景、物品、风景、食物、动物等类别，全面覆盖常见事物的各个信息维度，满足视频内容全方位标签化。

简单易用

对外提供公有私有一体化、直播点播统一化的标准 REST API 接口，可与云点播服务、COS 存储、第三方存储系统快速打通，支持便捷接入、自主调度切换。

倍速可控

基于分布式视频处理算法，对于不同客户可以满足不同倍速、不同并发、不同识别粒度的处理要求，自适应满足用户处理效率和成本的平衡，提升性价比。

高可定制

接入简单、成熟稳定、高效灵活的 API 接口，为用户量身定制视频智能服务私有化中台，帮助用户构建安全稳定、高效可靠、性价比高的视频云服务生态。

准确高效

海量的数据样本及丰富的特征数据分析模型，对视频每一帧进行画面、音频、文字多角度分析，从而提供准确、全面的音视频内容结构化识别能力。

智能识别有什么应用场景？

视频生产

通过智能识别技术，用户可以轻松高效地从海量视频中找出自己所关注的目标人物在历史视频中出现的时间点、人脸所在画面区域以及持续时间，从而快速找出相关创作素材，提升后期创作效率。

广电编目

广电行业通过智能识别可以高效理解海量视频内容信息，改变以往人工编目效率低下的情况，借助识别出来的视频标签（包括人物、场景、关键词等），可以快速地对视频进行归档和标签检索。支持广电用户私有化部署。

视频广告

智能识别可以自动识别出视频中用户关注的品牌 LOGO、场景等出现的时间点以及所在区域，借助这些信息可进行广告精准化投放，从而提升广告转化率和用户收益。

智能字幕

智能识别可以根据点播视频中的音频自动生成字幕文件，也可以自动给直播流加上实时字幕，或进行会场实时转译，便于会后的会议纪要整理，还可以辅助速记员提高效率。

智能识别支持哪些视频格式？支持音频吗？直播流呢？

音频支持 WAV、MP3、AAC、FLAC。
视频支持 MP4、FLV、MKV、AVI、RMVB、TS、FMP4 等常见音视频容器格式。
直播流支持 FLV、RTMP、HLS、DASH 等音视频传输协议。
若有其他不常见格式且视频量较大，请向您的腾讯云商务提出申请，或联系视频智能服务官方 QQ：3032247607。

词条知识树 (9个知识点)