首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

语音评测之——websocket

前言 前段时间小编收到一份测试任务要求对搜狗输入法的语音功能进行评测评测任务主要拆分为评测语料的选取和整理,硬件的调研和采购,评测工具的开发以及评测的执行和结果整理。...小编负责评测工具服务端的开发工作,主要使用了websocket的技术,此次与大家做一个简单的分享。 评测过程 语音评测过程中由web端连接音响实现语音的播放功能,手机客户端接收语音并处理。...评测过程会逐条播放音频,每一条音频播放后web端需要知道每个手机客户端的状态(是否语音处理完毕,是否准备好接收下一条语音等等),以此来决定何时开始播放下一条音频;同理客户端也需要实时接收到web端的播放状态...在本次评测过程中由于客户端与服务端通信频繁,且对实时性要求较高,开始便考虑使用长连接的方式。...把 “Sec-WebSocket-Key” 加上一个特殊字符串 “258EAFA5-E914-47DA-95CA-C5AB0DC85B11”,然后计算 SHA-1 摘要,之后进行 BASE-64 编码,

3.4K10

ASR(语音识别)评测学习

一、引言 小编新接触语音SDK项目,SDK无UI、底层调用多个C++算法库、提供的是AI服务。语音AI项目,识别效果是至关重要的一环,识别效果评测也是一项测试重点。...希望对测试小伙伴有所帮助~~(●—●) 二、ASR流程、系统结构、评测指标及评测模型 1、语音识别(Automatic Speech Recognition,ASR) 语音识别,也被称自动语音识别,所要解决的问题是让机器能够...4、语音识别(ASR)评测指标 语音识别(ASR)评测指标:WER(字错误率)和SER(句错误率) (1)....录入语音时长(0秒 1秒 1分钟内 >1分钟) (10).对话方式(间隔 连续 单人 多人) (11).特殊发音(比如普通话中sh与s ping与pin l与n f与h) 四、ASR评测方案制定...1、ASR评测方案设计——确定测试场景(简单举例) 考虑评测的各种影响因素,需要先确定某些维度(下例),制定一个测试场景评测: 确定:语种分类(普通话)、声音来源(人声录音)、对话方式(单人)、语音内容

7.7K51
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【AI专栏】语音合成系统评测介绍

    本文针对TTS前端、后端的问题介绍了一种包括主观评测、客观评测TTS测试方法。...在合成语音过程中引入背景噪声、字词间隔不顺畅。 二、客观评测 针对前后端可能存在的问题,本评测方法选择如下语料和指标对TTS系统做客观评测。...,准备测试语料,包括语料文本,待检查词汇,标准发音等,合成语音后人工评测发音准确率。...三、主观评测 1、MOS评测 国际上对语音自然度的评测,一般是使用MOS评测,邀请听音人对被测系统输出语音打分衡量。...目前我们的评测是培训众测用户做为听音人,流程大致如下: (1)双方语音音量归一化; (2)语音字词发音准确性校验; (3)生成众测问卷,语音顺序交叉打乱; (4)众测用户培训,试听自然人声和较差合成音锚定打分标准

    11.5K20

    Chrome语音搜索评测:效果华丽!可惜大墙相隔

    笔者使用中文普通话进行了一轮评测,识别效果超出我的预期。除了PC端使用场景有限,识别效果仍不够完善,最大的问题是:得访问外国网站。下面是一个简单评测。...11、甚至有些,根本无法识别。 12、防噪功能不好。虽然在封闭空间、在夜深人静之时,不说话,拿着话筒抖动,震动导致的声音都会让它会不断识别,不断识别,不断识别。...如果不访问外国网站,别说语音搜索,访问Google也会经常出现大家熟悉的界面。 评测总结: Google语音搜索对于中文用户来说具备可用性。...Google语音搜索进步不在于其提供了“语音”这种输入方式。百度、搜狗等搜索引擎在PC端都已提供语音搜索功能,进步在于“自然语言”的语义理解。...语音输入除了声音转换为文字外,搜索引擎更需要从自然语言精准理解用户需求,并以知识图谱的形式反馈个性化的结果。从评测看,Google表现优秀。

    4.6K70

    直播继续搅局11

    天猫:王牌主播打头阵 作为11赛场的擂主,天猫的11筹备自然是最值得期待的,截至目前公布出的成绩,也能够看出其火热程度。10月20日晚8点,天猫11正式开启预售。...这是天猫11连续第2年降低满减门槛,消费者凑单将更容易。在监管大力整治垄断行为的背景下,各大平台都将刀刃对向自己,试图更加获得消费者的认可。 另一方面天猫也将绿色环保理念融入此次11。...今年11发布会上,天猫宣布将致力于打造一届“低碳11”,同时将全面升级已诞生15年的公益宝贝项目。如今阿里已经成为互联网行业最大的绿色电力交易主体。...今年京东11除了不熬夜外,优惠政策也迎来全面升级。...抖音11好物节从10月15日就已经正式上线,一直持续到1111号,活动也分为“好物提前买”和“天天抢好物”阶段,形式和花样可谓繁多,也和抖音的平台风格极为匹配。

    13.6K30

    如何评测语音技能的智能程度(2)——服务提供

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第2篇。 “你是做什么行业的?”...前一篇文章,笔者重点谈了【意图理解】维度,本篇文章为大家带来【服务提供】维度的评测点拆解。 在谈及这个模块的时候,评测考量的是场景理解及整合应用CP和SP的能力。...故而内容展示的合理程度,也应该成为一个评测标准。 就算是复杂的内容,也需要做好信息处理,根据用户的情况,分层次分阶段,进行内容展示。 为了帮助大家理解,我举几个语音交互层面的例子。...你通过语音跟对方完成指路行为。注意,这是一个纯语音对话的场景。...故而列为评测点。 阶段性结尾 写东西不光光是罗列和定义评测点是什么,笔者更期望在每个点上,加入更多的业务思考和理解。 ?

    3.9K20

    如何评测语音技能的智能程度(1)——意图理解

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第1篇。...不过多举例,但是有无处理方案,应该纳入进评测点。 【意图理解】(5)目标达成表现 核心考量点:帮助用户达成目标中间所花费的成本。...所以在当前的技术实现下,输出了过往在工作中一些评测产品以及处理问题的具体表现。 实际上,原本在意图理解这个单元模块,有更多评测点去列举,但是受限于篇幅以及能力所限,删掉的一些内容。...(11)如果用户表达的文本过长,意图过多,如何处理? (12)用户话说到一半,能不能猜测,并提前完成服务? 上述我提到的种种问题,其实都可以设计考核指标。...既然是评测指标,自然是有权重之分。 有些是可以努力做好的部分,比如前文中就【意图理解】这个维度提及的5个模块,各个例子的列举,都是基于用户的对话日志后台,是实际业务中非常高频的。

    2.8K31

    如何评测语音技能的智能程度(3)——交互流畅

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第3篇。...评测点已经讲完了,十分清晰,几乎每一个互联网从业者都能够说出个1234,然后呢?...语音交互这件事,本身就是因为语音输入的高效性。 当用户发出了需求,希望尽快拿到反馈, 现在的用户极其没有耐心,速度一旦过慢,注定会被弃而不用。 ?...体验各家智能语音助手,在这一块的表现上各不一致,故而列为评测点。 行业新的新手引导教学其实非常多的种类,滑屏海报,蒙版遮罩,文字tips,互动式引导。...同样的,在【交互流畅】这个单元模块,有更多评测点去列举,但是受限于篇幅以及能力所限,删掉的一些内容。保留以及删除评测点的原则,也是基于评测指标的普适性。 同样用提问的方式,列举一下我删除掉的考核点。

    3.8K20

    链笔记葫芦笔记综合评测:优点、缺点、建议

    包括 Roam 在内的其他链笔记还在开发中。...与其他软件的宣传语不同,这句话没有突出葫芦笔记的特点,甚至不知道葫芦笔记是链笔记。...因此,我一般采用 链笔记 + 在线协作文档工具 的使用组合策略。以我为例,我正在使用 Notion 类的 FlowUs. Notion 很多笔记用户都有了解。...如同《Notion 类软件横向评测:Notion、FlowUs、Wolai》这篇文章中根据这三款软件的具体功能和价格对比,FlowUs 具有高性价比。...国产组件库 NotionPet:为笔记嵌入可视化模块 ——关于 NotionPet 的专文评测生产力工具——笔记软件 FlowUs 深度评测FlowUs 息流 - 新一代生产力工具​

    1.1K20

    链笔记·思源笔记综合评测:优点、缺点、评价

    优点所见即所得:目前链笔记中貌似只有 Obsidian 和 思源笔记实现了所见即所得。...支持完整的大纲编辑器功能:比较有名的链笔记几乎都是大纲型编辑器,只有Obsidian 和思源笔记属于文档型编辑器。Obsidian 虽然插件生态极其完善,绝大部分功能都很棒。但是总感觉差临门一脚。...一切皆是内容块:与Roam、Logseq、Obsidian 等链笔记不一样,思源笔记中并没有区分 Page 和 Block,而是实现了类似大纲编辑器鼻祖 Workflowy 一样的设计——一切皆是内容块...如同《Notion 类软件横向评测:Notion、FlowUs、Wolai》这篇文章中根据这三款软件的具体功能和价格对比,FlowUs 具有高性价比。...国产组件库 NotionPet:为笔记嵌入可视化模块 ——关于 NotionPet 的专文评测生产力工具——笔记软件 FlowUs 深度评测FlowUs 息流 - 新一代生产力工具

    3.1K60

    如何评测语音技能的智能程度(4)——人格特质

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第4篇。...前三篇文章,依次拆解了【意图理解】、【服务提供】、【交互流畅】三个维度,如果这些维度的各个评测指标全部达标,即是一款水平线以上的智能语音助手,但是距离“令人愉悦和兴奋”还少了一个维度,即——人格化。...大厂制造,资源齐备,各个性能表现都十分优秀,同一个时期的产品,硬件配置,技能,语音交互表现差不太多。...现在的语音助手大多是一个工具型产品,并基于此,努力附加人格化。 高德语音导航这个工具的使用体验无疑是做得令人愉悦的,与它们的互动充满了乐趣。 ?...笔者能列举的计算机表现方式:文字、表情、语音、音效、图像、光效、甚至是机器人的肢体动作。这些方式,叠加的越多,其表现力越丰富。

    2.6K20

    11的解药在B端

    11的解药在哪里,抑或是电商行业的解药在哪里,或许,早在新零售的概念被提出的那一刻开始就已经有了答案。 这个答案,就是B端。...当供求两端的角色开始发生改变,我们同样看到的是一场有关11的嬗变开始出现,它让我们看到了11新生的希望。从这个角度来看,11的解药,同样在B端。 第四,一个大的市场正在B端打开。...无论是从B端市场的尚未被开垦,还是B端市场为我们展示出来的纵向上的巨大的想象力,我们都可以将B端市场作为一个解决11痛点和难题的正确方式和方法。 表面狂热的背景下,透露出来的是11的无限的焦虑。...纵然是有庞大的销量作为支撑,依然没有延缓人们对于11的质疑与审视。 寻找破解11困局的解药,成为每一个人都在思考的重要课题。...在那里,在B端市场上,或许,才有根治11顽疾的灵丹妙药。

    1.7K30

    指标权重设计——如何评测语音技能的智能程度(终篇)

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第5篇,也是最后一篇。...评测语音技能的智能程度有4大维度: 如何评测语音技能的智能程度(1)——意图理解 如何评测语音技能的智能程度(2)——服务提供 如何评测语音技能的智能程度(3)——交互流畅 如何评测语音技能的智能程度(...如果某个玩具/手办具备语音交互功能,用户非常在意玩具/手办的语音交互是否匹配角色气质,故而对这类用户而言,“人格特质“就要要求高权重。...语音技能评测指标的选择和量化 这份清单花了笔者太多的时间,仍然有太多的问题值得讨论: 为什么是4个维度,而不是5个或者是3个? 基于什么依据设置每个维度的重点和加分项?...语音技能服务的上限和下限 除去调研和评测其他智能语音技能,这份清单的还可以用于服务的产品定位,以及作为清单来评价语音技能服务表现。

    4.8K20

    链笔记 Roam Research 综合评测、学习资源、使用教程分享

    介绍链笔记赛道的开创者。优点编辑器:流畅丝滑,性能比较好。这个有主管色彩。仅供参考。链细节:作为开创者,可能是做的最好的。...这些软件我都有试用或者深度使用,参考我以往的评测文章即可得知。然而,从链笔记的链设计细节、编辑器的实际体验来看,我依然愿意现在将 Roam 视为第一。...具体评测见下文:链笔记软件综合评测:Roam Research、 Obsidian、Logseq 、思源笔记 、Roam Edit 、RemNote、葫芦笔记、TiddlyWiki、Athens、TriliumRoam...具体评测参见下文:免费、好用、强大的开源笔记、云笔记软件综合评测学习资源/使用教程Roam 相关学习资源很多。...国产组件库 NotionPet:为笔记嵌入可视化模块 ——关于 NotionPet 的专文评测相关生产力工具测评和方法论介绍笔记软件的历史、选择策略以及深度评测生产力工具——笔记软件 FlowUs 深度评测

    1.8K30
    领券