专业智能高效的语音处理服务
中国互联网络信息中心 | 工程师 (已认证)
近年来,随着深度学习与生成式人工智能的快速发展,语音合成(Text-to-Speech, TTS)与语音转换(Voice Conversion, VC)技术日趋...
国家邮政局监测数据显示,今年“双11”期间,全国快递业务量累计139.38亿件,日均揽收量达6.34亿件。
浙江大学湖州研究院 | 前端开发工程师 (已认证)
在智能设备普及的今天,“小爱同学”“Siri”等语音助手的唤醒交互早已深入人心。但你是否想过,在浏览器环境中,仅通过前端技术就能实现类似的“关键词唤醒”功能?无...
近日,科技巨头谷歌(Google)在美国多个州法院提起民事诉讼,剑指一个长期活跃、疑似位于中国境外的短信钓鱼(smishing)犯罪团伙。该团伙通过伪装成E-Z...
端到端多模态语音识别技术通过整合语音、唇形、上下文等多种信息,显著提高了语音识别的准确率和鲁棒性。
2025年10月18日,韩国首尔东部地方法院对一起以柬埔寨为基地、专门针对韩国民众实施语音钓鱼诈骗的犯罪团伙作出一审判决:主犯徐某(32岁)被判处6年有期徒刑,...
在语音AI技术不断演进的今天,传统外呼机器人正被大模型彻底重塑。 从“能打电话”到“会沟通”,从“执行脚本”到“理解意图”,外呼行业正进入一个由 语义智能驱动...
国际声学、语音与信号处理会议(ICASSP)即将召开,某中心在本届会议上发表了36篇研究论文,主题涵盖从经典的噪声和回声消除信号处理问题,到歌声与乐器音轨分离、...
在翻译会话期间,智能助手并行运行两个自动语音识别模型,同时运行一个独立的语言识别模型。输入语音同时传递给两个自动语音识别模型。然而,根据语言识别模型的分类结果,...
某中心研究人员在本年度声学、语音与信号处理国际会议上发表了50多篇论文。其中多数聚焦于自动语音识别及相关主题,如关键词识别和说话人识别,但也涉及计算机视觉和联邦...
“张总亲自打电话过来,说项目紧急,让我马上把财务系统的临时权限给他……我没想到会是假的。”某科技公司IT管理员小陈(化名)回忆起几天前的经历,仍心有余悸。就在那...
在AI技术日益普及的今天,诈骗手段也悄然“升级”。你接到一通电话,那头传来的是你母亲焦急的声音:“孩子,我出事了,快打钱!”——但声音虽真,人却未必是她。近年来...
你接到一通电话,听筒里传来公司CEO熟悉的声音,语气急促:“马上安排一笔500万的紧急付款,对方账户我已经发你邮箱了。”你照做后却发现,老板此刻正在国外开会,根...
近年来,自动语音识别已转向全神经网络模型。连接时序分类损失函数因其无需依赖先前上下文即可进行预测,成为ASR(特别是端到端ASR)的有吸引力的选择,从而产生推理...
近日,谷歌威胁情报组(GTIG)发布一份重磅安全报告,揭露一个名为UNC3944的网络犯罪团伙正利用“打电话骗密码”的老套路,结合高阶技术手段,对美国零售、航空...
在IEEE自动语音识别与理解研讨会(ASRU)上,我们提出了一项工作,通过训练机器学习模型来确定何时真正需要澄清,从而减少不必要的后续问题。
设备端自动语音识别(ASR)模型接收语音信号,输出按概率排序的识别假设集合。这些假设以网格形式表示——一个包含识别单词及单词间转移概率的图结构。
循环训练语音合成和语音识别模型,以及通过语言理解改善语音韵律,仅仅是语音相关领域交叉融合的几个例子。
本周,IEEE国际声学、语音与信号处理会议(ICASSP)以虚拟形式拉开帷幕,两周后(5月22-27日)将在新加坡举行线下会议。ICASSP是IEEE信号处理学...