首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    专栏 | 极限元CTO温正棋谈语音质检方案:从关键词检索到情感识别

    机器之心专栏 作者:温正棋 极限元智能科技 本文作者温正棋为极限元智能科技 CTO 、中国科学院自动化研究所副研究员,毕业于中国科学院自动化研究所,先后在日本和歌山大学和美国佐治亚理工学院进行交流学习,在国际会议和期刊上发表论文十余篇,获得多项关于语音及音频领域的专利。其「具有个性化自适应能力的高性能语音处理技术及应用」获得北京科学技术奖。在语音的合成、识别、说话人识别等领域都有着多年深入研究经验,并结合深度学习技术开发了多款语音应用产品。 为了提高客户满意度、完善客户服务,同时对客服人员工作的考评,很多企

    012

    微信智能语音服务上线,集成语音识别、语音合成、声纹识别等功能

    编辑导语 近日,腾讯云正式上线智能语音服务。智能语音是由腾讯微信AI团队自主研发的语音处理技术,可以满足语音识别、语音合成、声纹识别等需求。 这是继微信支付提速、微信公众号CDN加速、微信公众号安全护航等一系列动作之后,腾讯云联合微信发布的又一重大举措。腾讯云智能语音服务将以强大的垂直领域定制化服务,打造专业高效的语音大脑。 一、识别率行业领先云端+嵌入式开放 语音作为继键盘、鼠标、触屏之后人机交互的新体验,其识别技术被广泛应用在呼叫中心、网络搜索、智能终端、移动应用、人工智能等各大领域。 腾讯云平台联合微

    08

    初音未来、洛天依、镜音......揭秘虚拟歌姬背后的大BOSS

    提到虚拟歌姬,你的第一反应是谁? 洛天依、初音未来、乐正绫、巡音、Gumi、言和、镜音、东方栀子......。(没上榜的记得评论区留言) 在二次元的世界里,虚拟歌姬是一个特殊的存在,他们不是"活人",但有粉丝、有流量、有作品,其影响力、待遇不亚于一个鲜活的网红IP。 以洛天依为例,她是全世界第一款中文声库和虚拟形象,也是首位登上中国主流电视媒体的虚拟歌手,与杨钰莹、周华健、王源等一众明星在春晚同台合唱和歌舞表演。 她们一步一步成长,不断给我们带来“一字一句的美妙体验”。而成就这种“美妙体验”的,正是得益于

    04

    使用Python,让会话AI快速获得英伟达GPU加速,你需要认识这个工具

    让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音已成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。 目前,语音服务存在于各种场景中,包括实时会议记录、视频实时直播字幕、呼叫中心语音质检、实时会议记录等。想要实现不同的语音服务,这涉及到方方面面的技术,例如,在进行实时会议记录任务时,需要将会议中的音频实时转写为文字,辅助会议记录工作,同时适用于电视会议等远距离场景,这涉及到自动语音识别(ASR)技术。 除此以外,我们在日常生活中,也经常遇到需要将文本转化成语音的技术(TTS) ,该技术可以通过自然逼真的智能语音,让机器拥有「说话」的能力。 那么,有没有一种技术,可以同时完成自动语音识别、语音合成技术的任务? 今年,英伟达发布了 NVIDIA Riva,这是一种现成的语音服务,可以轻松部署在任何云或数据中心。NVIDIA Riva的设计旨在帮助用户轻松、快速地访问会话 AI 功能,实现开箱即用,通过一些简单的命令和 API 操作就可以快速构建高级别的语音识别服务。该服务可以处理数百至数千音频流作为输入,并以最小延迟返回文本;还能快速构建高级别的对话式 AI 服务。 NVIDIA Riva是一个使用了 GPU 加速,快速部署高性能会话式 AI 服务的 SDK,可用于快速开发语音 AI 的应用程序。Riva SDK 在 NVIDIA GPU 上运行,在高吞吐量水平下提供最快的推断响应。 目前,NVIDIA Riva整合了 ASR 和 TTS 等智能算法引擎,用户可以使用这些功能进行科学研究。

    02

    极限元温正棋:从前端信号处理到语音识别、对话、声纹情绪与合成,要打造智能交互闭环 | 镁客请讲

    在温正棋看来,鉴于开源等原因,智能语音的核心技术已经不存在太大差别,而他们相比之下的优势更多集中在业务服务能力及闭环技术的应用层面。 前段时间,亚马逊智能音箱Echo时而抽风的怪笑声令消费者“震惊”,虽然到底是什么原因造成的,我们目前尚不清楚。不过,我们可以确定的是,语音交互已经成为了人们智能生活中不可或缺的一个因素。 选择极限元 他的初衷就是把研究转化为产品应用到市场 “我自己是中科院自动化所模式识别国家重点实验室的副研究员,就想把研究做成产品运用到市场上,这是我当初加入极限元的初衷。”极限元CEO温正

    03

    AI在华东金融专场 | 腾讯云核心伙伴进阶营走进上海

    11月18-19日,“腾讯云•核心伙伴进阶营•基础产品专场”活动在上海成功举办。本次活动选取了适合合作伙伴推广的私有化标准产品,从伙伴激励、渠道赋能、技术支持等多个维度助力合作伙伴提升在腾讯云基础产品的能力,帮助合作伙伴将AI产品集成到客户的项目中,解决数字化转型中遇到的问题。 随着人工智能技术的发展,人工智能相关的产品服务已广泛渗透到金融行业中,且日渐成熟,并推动银行、保险、资本等金融行业的深刻变革。依托在金融行业的业务落地经验,并通过持续不断的深耕各行业与区域,将AI生态更深、更广、更全面的融入各行

    02

    对话腾讯天琴赵伟峰:当音乐与科技结合,会碰撞出怎样的火花?

    天琴座是北天银河中最灿烂的星座之一,传说这把“天琴”属于古希腊音乐天才俄尔普斯,每每“拨动”它的琴弦,美妙的音乐便会流淌出来,飘散于世间的各个角落,令人们陶醉其中。腾讯音乐旗下的天琴实验室正如这把精妙绝伦的天琴一样,同样为人们带来了完美、流畅的音乐。近些年来,天琴实验室一直致力于音频技术的创新和研发,他们已经推出了听歌识曲、哼唱识别、翻唱识别、智能字幕、智能修音、臻品音质、DMEE等音频创新功能和产品。目前的研究方向包括歌曲识别、MIR音乐音频理解、音频合成和处理、歌声ASR与歌词时间戳技术、录唱音质音效等

    01

    云视频会议背后的语音核心技术揭秘:如何进行语音质量评估?

    导读 | 自疫情发生以来,腾讯会议每天都在进行资源扩容,日均扩容主机接近1.5万台,用户活跃度攀升。在如此高并发流量的冲击下,腾讯会议如何保证语音通信清晰流畅?如何对语音质量进行评估?在【腾讯技术开放日·云视频会议专场】中,腾讯多媒体实验室音频技术专家易高雄针对语音质量评估进行了分享。 点击视频,查看直播回放 一、语音质量界定     音频和语音是电声学下面两个不同的学科分支,属于两个不同的应用,两者在应用目的、使用场景、行业和用户认知统一度三方面存在差异,所以对于语音质量测试来说,首先要界定一下评估对象

    02

    腾讯多媒体实验室商世东:腾讯会议背后的实时语音端到端解决方案

    导语: 受疫情影响,很多企业开启了线上办公模式,视频会议成为刚需、高频的办公工具。用户爆发式的增长,让各远程办公应用面临了巨大挑战,除扩容服务器等硬件设施外,保证高品质的通话体验、降低端到端的延迟技术架构,成了保证远程会议体验的关键点。 面对这次高并发流量的冲击,腾讯会议通过融合经典信号处理、心理听觉和深度学习理论,针对端到端音视频通信链路上的复杂特性,对音视频在云端和用户终端的网络传输环境进行了优化,为用户提供了清晰流畅的语音服务。 近日,腾讯多媒体实验室高级总监商世东受云+社区沙龙online邀请,

    03
    领券