前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >会议主题:对齐一下

会议主题:对齐一下

作者头像
小腾资讯君
发布于 2024-04-17 10:10:36
发布于 2024-04-17 10:10:36
2820
举报

一人说一个尴尬的开会经历。我先说!

有一次出差,在电脑打开腾讯会议,另一边是线下会议室里激烈讨论的几个同事。一阵嗡嗡嗡后,轮到我发言,我一顿输出:刚刚XX说的很好,但我觉得这个问题的关键,是要找到关键的问题……

还没说完,收到同事的私信:刚不是XX在说话。

线上开会,「对齐一下」,是工作中常有的事情。如果连人都对不齐,就很尴尬。

我许愿:请AI,帮我把会议室里说话的人分出来。

许愿成功了。

腾讯天籁实验室,腾讯最会开会的实验室,也是腾讯会议背后的技术团队,一直致力于让开会这件事情更丝滑。

最近,他们又搞出了一些开会利器。

(「多人分镜」模拟演示,实际效果以产品功能为准)
(「多人分镜」模拟演示,实际效果以产品功能为准)

首先是多人分镜功能

电脑前的你,在人多的时候,很难分辨清楚线下是谁在说话。

但AI可以。AI不仅听得清,还能把面对着同一个摄像头的四个人,分成四个视频小窗格,打在公屏上。让开会更高效,也让摸鱼更困难。

多人分镜的底层逻辑,其实是通过音视频多模态AI算法,快速识别不同的声纹、唇动等特征,追踪说话的人,准确分辨出不同的说话人。(注:腾讯会议与腾讯天籁不会储存发言人的声纹。)

图片
图片

识别不同说话人之后,AI还会始终帮你定位正在说话的人,让说话人处于镜头的C位,还可以在不同说话人之间快速切换。

哪怕他们像我的同事一样,喜欢开会的时候走来走去(是在换位思考?),AI也能持续定位到他。

(音视频多模态AI算法,在会议中持续追踪说话人)
(音视频多模态AI算法,在会议中持续追踪说话人)

第二个开会利器,是更优秀的去混响能力

线上接入大型会议,是开会中特别难受的体验。在超大型空旷会议室,玻璃和墙面会让声音产生严重反射,产生混响。

混响,是声音在空间里反射、散射再传到你的耳朵中。混响严重的时候,你在线上听会,体验就像躲在大礼堂的三楼后座听领导讲话,领导一句话说完,声音的拖尾还继续传到你这里。

图片
图片

效果大概是这样:「我简单说两句,两句~句~」

为了解决混响问题,专业开会的天籁实验室,在3.0版本的天籁inside解决方案中,打造了业界领先的AI+16阵列麦的拾音矩阵,使得在房间里任何位置发言,都像面对面说话一样清晰。

第三是智能音幕

在多人会议室中,旁边不免会有其他人窃窃私语,或是有环境噪音的干扰。

由于天籁inside的收音效果非常好,这些小声说话,也能被线上参会者收听到,反而很干扰听感。

比如说,有个朋友(真不是我),常常在开会的时候刷视频号,又被麦克风收音进去了,没少挨领导批评。

这个补丁不能不打上。天籁团队打造了「智能音幕」的功能。

图片
图片

它像是一道虚拟的音频屏障,可以让说话人的声音清楚呈现,同时屏蔽屏障外的声音。这一虚拟音频屏障还可以实时调整方向,灵活满足需求。

以上的种种能力,都由天籁inside 最新的3.0版本——16mic多模态人像分割解决方案提供。只要你的办公场所的设备装载了天籁inside,就可以使用「多人分镜」等开会利器。目前使用腾讯天籁insde解决方案的产品有这些:

图片
图片

接下来,天籁inside 解决方案也会持续开放给合作硬件厂商,提供全链路深度合作支持,从算法层、芯片层、硬件层到产品层,全方位护航产品研发。

以后,在所有贴有这个logo的硬件上,都能体验到天籁inside解决方案。

图片
图片

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
专业降噪,GME 有一群噪音猎人精准消除 300+ 种环境噪声|技术分享
先介绍下腾讯游戏多媒体引擎 GME 背后的音频黑科技团队——腾讯会议天籁实验室。这是一群“噪音猎人”,他们沉浸在实验室,也穿梭在菜市场、游荡在马路边、商场等各种生活常见场所。噪音是他们的猎物,被狙击、捕获、并消除。 “猪肉铺的老板开始剁肉末了,走!” 王燕南两眼发光,如同饿虎扑食一般冲过去,一根收音棒伸到了桌子前,听着砍刀和砧板激烈碰撞的声音,王燕南如获珍宝。“小伙子,我看你好几天啦。不来两斤五花肉吗?”肉铺老板调侃道。 王燕南是 AI 降噪团队中的成员,一名来自中科大的博士。从本科到硕士再到博士,多年的音
腾讯游戏多媒体引擎GME
2022/11/03
8790
专业降噪,GME 有一群噪音猎人精准消除 300+ 种环境噪声|技术分享
腾讯会议如何保证语音质量?音频信号处理中有这些秘籍!
导读 | 腾讯会议在去年年底推出,集结腾讯在AI、云计算、安全等方面的能力,全方位满足不同场景下的会议需求,在短短两个月内就突破千万日活大关。面对多样且复杂的场景,比如开会环境嘈杂、同一地点多设备接入、房间声学参数不理想等,腾讯会议如何通过对音频信号的处理持续保障高品质通话,提升沟通效率?本文是腾讯多媒体实验室音频技术专家李岳鹏在「腾讯技术开放日·云视频会议专场」的分享整理。 点击视频,查看直播回放 一、TRAE技术降噪增益揭秘 先简单讲一下VOIP中语音数据实时传输路径图,我们可以看到远端的数据通过
腾讯多媒体实验室
2020/04/01
7.7K1
道一云 X 腾讯会议 :首个打通线上线下的智能会议解决方案|腾讯SaaS加速器·案例库
来源 | 腾讯SaaS加速器首期项目-道一云 ---- 疫情期间,为了满足团队沟通的需求,不少道一云的客户纷纷尝试使用了像腾讯会议这样的在线会议系统,这种随时随地都能举行的会议形式相比传统线下会议更加高效,让不少企业管理者尝到了甜头。 而随着企业陆续复工,一种新的开会形式逐渐变成常态,一部分参会者在线下参会,一部分参会者通过在线方式接入会议,如何有效组织这种混合式会议,变成了一个新的课题。 为满足客户的使用需求,道一云第一时间完成了腾讯会议与会议助手的对接,形成了线上+线下同步开会的整体软硬件解决方案
腾讯SaaS加速器
2020/06/09
2.8K0
GME背后的黑科技团队天籁实验室获得ICASSP 2023语音信号质量增强挑战赛冠军!
跟大家分享一个好消息! 腾讯会议旗下、GME 背后的黑科技团队天籁实验室参加由国际音频顶级会议 ICASSP 联合微软发起的 2023 语音信号质量增强挑战赛(SSIC),并荣获 SSIC 全部两个赛道的冠军,并在降噪、混响、卡顿、响度、音质修复等多个子项均达到了领先水平! 图示:比赛成绩 去年,天籁实验室在 ICASSP DNS 2022 全频带实时个性化语音增强 track 2 比赛已获得总分第一。点击查看详情>> ICASSP 2023 语音信号质量增强挑战赛(SSIC)主要面向如何在实时通信系统中
腾讯游戏多媒体引擎GME
2023/02/13
1K0
GME背后的黑科技团队天籁实验室获得ICASSP 2023语音信号质量增强挑战赛冠军!
专访腾讯多媒体实验室商世东:咬咬牙也要跟上新版本的发布
刚刚毕业的时候,我在摩托罗拉做音频方面的工作,一做就是将近十年的时间。2010年,我去了杜比实验室,算起来是国内入职杜比研发团队的第二个员工。当时负责整个杜比中国的工程团队,差不多有五六十个人的规模。
LiveVideoStack
2020/04/23
1K0
专访腾讯多媒体实验室商世东:咬咬牙也要跟上新版本的发布
上海德国中心携手森海塞尔打造先进的混合会议音频体验
TeamConnect Ceiling 2赋能上海德国中心实现音频升级,打造线上线下高质量沟通场景
云上计算
2023/03/06
4070
上海德国中心携手森海塞尔打造先进的混合会议音频体验
腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?
作者 | 伍杏玲 出品 | AI 科技大本营(ID:rgznai100) 远程会议已成为我们常规的工作沟通方式,在线交流打破时间、空间的限制,给予我们便利之际,也屡遭尴尬: 忘记静音,一边听会一边敲键盘,被对方提醒:“XX,麻烦静下音”; 自己正在讲话呢,身旁人走来走去有噪音,影响会议收听效果,你恨不得马上转移开会阵地…… 后疫情时代,远程会议有以下发展趋势:远程协作占员工的工作时间50-80%,线上线下混合会议将超过90%,视频会议功能将成为大部分会议的标配。因此提高远程会议的交互体验已成为厂商迫在眉睫的
AI科技大本营
2023/05/08
2.1K0
腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?
云视频会议“黑科技”,开放才是“硬”道理
疫情之下,“云办公”需求呈爆发式增长,推动 RTC(实时音视频)行业迅速发展。进入后疫情时代,在线会议成为企业高效办公的标配。数据显示,协作时间占员工工作时间的 50%-80%。针对项目讨论或与客户进行沟通的小型协作空间数量未来将大幅增长。越来越多的企业衍生出线上线下协同开会的混合式会议需求,随之而来的问题是如何有效应对企业会议室复杂场景的开会难题。 1多样性场景,在线会议挑战重重 传统在线会议产品更侧重于在企业内部沟通使用,形态上以专用设备和 PC 端居多。而当前的在线会议不再局限于内部,跨企业沟通需求呈
深度学习与Python
2023/04/01
2.6K0
云视频会议“黑科技”,开放才是“硬”道理
千万日活腾讯会议背后:深度学习的最新应用
导读 | 深度学习是实现语音增强最主要的方法之一,­帮助我们从带噪语音中提取尽可能纯净的原始语音,提高语音质量和可懂度。腾讯会议在去年年底推出,短短两个月内就突破千万日活大关。在多样且复杂的场景下,深度学习如何帮助腾讯会议在实时通话中进行去混响、声音事件检测和回声消除?本文是腾讯多媒体实验室高级研究员王燕南在「腾讯技术开放日·云视频会议专场」的分享整理。  点击视频,查看直播回放 一、经典的语音增强深度学习算法 语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑
腾讯多媒体实验室
2020/04/01
2.4K0
视频会议一体机的技术实践和发展趋势
作者 |  伟隆 钉钉蜂鸣鸟音频实验室 算法专家 在混合办公的常态趋势下,远程沟通协作的效率至关重要。然而,远程会议目前依然存在不少影响沟通的问题,比如缺乏会议室拾音和放音设备、软硬件设备不兼容、因远场拾音导致听不清等,这些问题都会消磨与会者的耐心,影响会议效果,让团队逐渐失去讨论的激情。 因此,无论是国外的微软、Zoom,还是国内的钉钉、腾讯会议,都在建立自己的硬件终端生态,期望通过硬件来解决线上、线下混合办公中的拾音问题,比如麦克风、音视频一体机、会议平板等。但即便如此,在线下开会时最常见的一个现象,依
深度学习与Python
2023/03/29
7440
视频会议一体机的技术实践和发展趋势
GME 受邀 2022 世界人工智能大会,探讨虚实互联的前沿技术、场景、价值
9 月 2 日下午,2022 世界人工智能大会“游戏·AI·元宇宙”高峰论坛在上海举办。本次论坛由上海市经信委、徐汇区人民政府指导,上海米哈游网络科技股份有限公司主办,徐汇区科委、文旅局、伽马数据、西岸集团特别支持,米哈游、Unity、腾讯、复旦大学等游戏、科技、教育领域的众多专家到场交流。 腾讯游戏多媒体引擎 GME (Game Multimedia Engine) 副总经理左小祥受邀参加演讲,分享了腾讯云在虚实互联视角下的场景洞察、技术成果及应用,与行业各方共同探讨虚实互联的发展和价值。 腾讯云 G
腾讯游戏多媒体引擎GME
2022/09/22
1.3K0
GME 受邀 2022 世界人工智能大会,探讨虚实互联的前沿技术、场景、价值
腾讯多媒体实验室发布新一代实时音频通信技术品牌——“腾讯天籁”
    2020年疫情的突如其来,让数字通信手段成为了人与人沟通的重要手段。从各地政府的抗疫行动部署,到基础行业的维持运行,再到企业复工后的生产安排,都离不开在线会议等重要数字化协同工具,同时也对实时音视频通信的稳定性和通讯效果提供了极大考验。     作为最受欢迎的在线会议软件之一,腾讯会议基于高清、稳定、安全的视频会议服务,上线两个月内日活跃账户数就超过1000万,成为中国最多人使用的视频会议产品。其赢得用户青睐背后,是腾讯过去二十余年在音视频通讯领域的经验和技术能力积累。 腾讯多媒体实验室的高级
腾讯多媒体实验室
2020/09/14
1.4K0
「数实融合,共建全真互联」更“会”开会的会议
2021年腾讯数字生态大会召开,旨在描绘云、AI、大数据、安全等关键技术的发展蓝图,展示腾讯最新的研究成果、战略规划、技术产品、解决方案,共同推进产业数字化和数字产业化过程中沉淀的行业最佳实践。
云巴巴
2021/11/04
6510
「数实融合,共建全真互联」更“会”开会的会议
DNSPod十问周康:如何成为办公硬件领域的乔布斯?
本期嘉宾 周康 成者科技 CEO 周康,成者科技CEO、首席产品官。2013年创办成者科技,通过AI和互联网技术,推动办公设备智能化。担任CEO期间,带领成者科技攻克书籍扫描技术,融入大量的AI视觉技术,优化扫描质量,并积累大量的技术壁垒和全球布局的专利技术,成者智能硬件也在短短四年时间,成为全球AI办公头部企业。产品销往160多个国家,为中国创造出海树立了榜样。成者旗下三家国家高新技术企业,研发实力出众,目前已完成数千万元A+轮融资。 主持人 赵九州 腾讯云-企业中心总监 赵九州,腾讯云-企业中心
腾讯云DNSPod团队
2023/05/17
5090
DNSPod十问周康:如何成为办公硬件领域的乔布斯?
森海塞尔TeamConnect Ceiling 2通过钉钉会议外设认证
在线会议音频解决方案“新势力”,森海塞尔商务通讯助力企业及学校畅享便捷高质量的线上会议
云上计算
2022/11/24
4900
森海塞尔TeamConnect Ceiling 2通过钉钉会议外设认证
“王叔,听得到吗?”
一是这些助听器虽然让会放大声音,但环境的噪音也随之放大。王洪升戴着助听器,抽油烟机、排气扇一开,就吵得头疼,甚至家乡发洪水的时候,他也被噪音所困。这是听力健全的人体会不到的痛苦。
小腾资讯君
2024/02/19
1810
球场之外,他们用AI给这支特殊的「中国女足」造了一双「耳朵」
机器之心原创 作者:张倩 提起中国女足,估计很多人都忘不了大年初六的那个不眠之夜。国足姑娘们在韩国女足 2-0 领先的巨大压力下舍命防守,最终以 3-2 的战绩完成了史诗级逆转,斩获亚洲杯冠军。这样的拼搏精神令人动容。 但很多人不知道的是,在无声的世界里,一支仅靠手语沟通的女足队伍也曾取得过骄人的战果。 湛江聋人女子足球队的姑娘们。图源:http://www.52hrtt.com/zw/n/w/info/H1568090270933 这支球队于 2013 年成立于广东湛江,2015 年站上了省残运会的最高
机器之心
2022/03/04
3290
腾讯会议突围背后:端到端实时语音技术是如何保障交流通畅的?
说到腾讯会议背后的实时语音端到端解决方案,大家可能第一时间就想到了PSTN电话,从贝尔实验室创造模拟电话开始,经过一百多年的发展,整个语音通信、语音电话系统经历了很大一部分变化。尤其是最近三十年来,语音通话由模拟信号变为数字信号,从固定电话变为移动电话,从电路交换到现在的分组交换。
腾讯云开发者
2020/03/25
6.4K0
音视频技术在云会议场景的拓展和未来
大家好,我是腾讯天籁实验室负责人、资深专家研究员商世东。非常荣幸能够在LiveVideoStackCon 2021音视频技术大会上海站现场为大家分享,过去两年我们通过腾讯会议探索音视频技术在云会议场景下的应用所收获的经验与心得,以及音视频技术在腾讯会议中的使用情况。基于此,我们进一步探索音视频技术在云会议场景下的未来。本次分享将从以下五个方面展开:
LiveVideoStack
2021/04/20
2.2K0
录音转写降噪,iFLYBUDS Pro为在线会议而生
在协同办公的洪流之下,线上会议日益成为目前最常见的会议形式之一。虽然线上会议不受时间和空间的限制,但它受会议参与者的环境限制,由此引发的各式各样会议难题让职场人苦不堪言,笔者对此也深有体会。
刘旷
2022/05/26
1.1K0
推荐阅读
专业降噪,GME 有一群噪音猎人精准消除 300+ 种环境噪声|技术分享
8790
腾讯会议如何保证语音质量?音频信号处理中有这些秘籍!
7.7K1
道一云 X 腾讯会议 :首个打通线上线下的智能会议解决方案|腾讯SaaS加速器·案例库
2.8K0
GME背后的黑科技团队天籁实验室获得ICASSP 2023语音信号质量增强挑战赛冠军!
1K0
专访腾讯多媒体实验室商世东:咬咬牙也要跟上新版本的发布
1K0
上海德国中心携手森海塞尔打造先进的混合会议音频体验
4070
腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?
2.1K0
云视频会议“黑科技”,开放才是“硬”道理
2.6K0
千万日活腾讯会议背后:深度学习的最新应用
2.4K0
视频会议一体机的技术实践和发展趋势
7440
GME 受邀 2022 世界人工智能大会,探讨虚实互联的前沿技术、场景、价值
1.3K0
腾讯多媒体实验室发布新一代实时音频通信技术品牌——“腾讯天籁”
1.4K0
「数实融合,共建全真互联」更“会”开会的会议
6510
DNSPod十问周康:如何成为办公硬件领域的乔布斯?
5090
森海塞尔TeamConnect Ceiling 2通过钉钉会议外设认证
4900
“王叔,听得到吗?”
1810
球场之外,他们用AI给这支特殊的「中国女足」造了一双「耳朵」
3290
腾讯会议突围背后:端到端实时语音技术是如何保障交流通畅的?
6.4K0
音视频技术在云会议场景的拓展和未来
2.2K0
录音转写降噪,iFLYBUDS Pro为在线会议而生
1.1K0
相关推荐
专业降噪,GME 有一群噪音猎人精准消除 300+ 种环境噪声|技术分享
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档