首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏物联网思考

    ASR推出首颗国产LoRa SoC芯片ASR6601

    ASR6501、ASR6502、ASR6505之后ASR推出首颗国产LoRa SoC芯片ASR6601,ASR6501、ASR6502、ASR6505都是SIP封装的LoRa芯片。 但是此次推出的ASR6601是SoC。 与此同时,ASR6601可以达到-148dBm的超高灵敏度,以及最大22dBm的发射功率,而QFN48最小尺寸仅6mm x 6mm。 ? 在高度集成的基础上,ASR6601还支持多种调制模式。由于收发器提供的线性频率范围为150MHz〜960MHz,ASR6601可以支持各类ISM频段。 ASR6601的推出为用户使用LoRa提供了更多选择。当然,也期待更多国产芯片问世。

    4.2K10发布于 2020-09-26
  • 来自专栏Soul Joy Hub

    ASR文本纠错模型

    ASR(语音识别)文本的错误类型很多,有多字、少字、错别字、同音近音字等等。 1. spm=1001.2014.3001.5502 上述模型考虑到了文本错字进行纠错,但在中文ASR的场景下,很多情况是由于中文拼音读音相同或相近导致的识别错误。

    3.2K20编辑于 2022-11-30
  • 来自专栏VoiceVista语音智能

    ASR and the Rise of Audio Intelligence

    With the Generative aspect of ASR poised for immense growth. Extractive ASR Extractive ASR is where the audio is transcribed into text for downstream processing; Generative ASR Generative extraction is a feature which is available with most ASR’s, and will grow with Some ASR providers allow for intents and entities to be defined within their ASR solution, hence we are seeing a close coupling of ASR and NLU.

    1.5K30编辑于 2023-03-03
  • 来自专栏物联网思考

    ASR6505 LoRaWAN通信(一)

    前言:在LoRaWAN网络中,终端设备直接与网关通讯,设备和设备之间不通讯。设备需要先入网,再上报数据。

    1.2K21发布于 2020-10-10
  • 来自专栏VoiceVista语音智能

    How to Evaluate a Deep Learning ASR System

    image.png image.png

    56710编辑于 2022-05-17
  • ASR初步使用与交互体验

    Automatic Speech Recognition这里简称为ASR,说到语音产品你会想到什么,是谷歌云还是微软云提供的文字转语音工具还是siri和ChatGpt等语言交互类的产品呢? ASR可提供转录服务、实时翻译、智能交互等场景。腾讯云也提供了产品尝鲜,各位小伙伴们也可以去试试看(https://cloud.tencent.com/product/asr#mod2)。

    41920编辑于 2024-06-16
  • 来自专栏搜狗测试

    ASR(语音识别)评测学习

    希望对测试小伙伴有所帮助~~(●—●) 二、ASR流程、系统结构、评测指标及评测模型 1、语音识别(Automatic Speech Recognition,ASR) 语音识别,也被称自动语音识别,所要解决的问题是让机器能够 3、ASR评测模型 评测模型,各家评测模型殊途同归。下图参考为例: 首先要有测试的数据集,测试的数据集也是有一段音频和标注。标注的就是标注音频内容,说的是什么。 4、语音识别(ASR)评测指标 语音识别(ASR)评测指标:WER(字错误率)和SER(句错误率) (1). ASR句子识别错误的个数,除以音频中句子总数即为SER 其计算公式如下所示: ? 三、ASR评测影响因素 1、语⾳识别准确率影响因素 影响到准确率的因素逐渐增多,其中主要因素有以下几种: (1). ;调研用户top N的数据内容类型;收集⾼频的badcase; 4、ASR评测方案执行——过程设计 小编所在项目的ASR评测需要基于语音SDK进行,具体执行方案还在修订,遇到的问题和解决方案,小编在实践总结后再总结分享

    10.4K51发布于 2020-12-24
  • 来自专栏腾讯云原生实践教程

    ASR语音识别应用实践指导

    ASR 语音识别引用深度融合了腾讯云 ASR 和 TRTC,用于将 TRTC 房间的语音数据实时放回,应用运行在云函数 SCF 上,通过 API 网关暴露请求入口,客户可以直接请求 API 快速发起 TRTC 补充:ASR 语音识别应用的官方指导文档(https://cloud.tencent.com/document/product/1154/65812)整体架构预览整体流程如下:图片环境变量在应用部署之后 参考:https://cloud.tencent.com/document/product/628/56544TRTC 房间的高级权限控制线上的 TRTC 房间往往都会开启高级权限控制,而当前最新版的 ASR

    1.3K51编辑于 2022-12-09
  • 来自专栏VoiceVista语音智能

    How ASR Technologies Evolve to Improve VoiceEnabled Devices

    49920编辑于 2022-09-02
  • 来自专栏物联网思考

    ASR6505 LoRaWAN通信(二)

    前言:在ASR6505 LoRaWAN通信(一)中谈到了设备入网、ClassA、C,本节聊聊设备的信道、发送、接收数据。

    1K31发布于 2020-10-18
  • 来自专栏产品经理的人工智能学习库

    语音识别技术 – ASR丨Automatic Speech Recognition

    语音识别技术(ASR)是什么? 机器要与人实现对话,那就需要实现三步: ? 对应的便是“耳”、“脑”、“口”的工作,机器要听懂人类说话,就离不开语音识别技术(ASR)。 ? 百度百科和维基百科 百度百科版本 语音识别技术,也被称为自动语音识别 Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键 它也被称为自动语音识别(ASR),计算机语音识别或语音到文本(STT)。它融合了语言学,计算机科学和电气工程领域的知识和研究。

    3K10发布于 2019-12-18
  • 来自专栏VoiceVista语音智能

    Sensory&Philips-Enhance ASR with Speech Enhancement

    Sensory, a Silicon Valley company enhancing user experience and security for consumer electronics, announced today its collaboration with Philips, a provider of advanced speech enhancement technologies, to offer a combined technology suite. This would package Sensory’s best-in-class speech recognition technologies TrulyHandsfree™ and TrulyNatural™ with Philips BeClear Speech Enhancement™ algorithms, resulting in significant accuracy improvement in noisy environments. By processing an audio signal with Philips’ echo cancellation, noise suppression and/or beam-forming processors before passing it to Sensory’s speech recognition engine, much of the unwanted ambient noise in a signal can be filtered out, leaving the critical speech portion of the signal largely untouched. This process allows Sensory’s already noise robust speech recognizer to decipher near- and far-field speech more accurately in conditions where very high ambient noise is present.

    59610编辑于 2022-09-02
  • 利用NLU标签优化ASR重评分模型

    技术背景当用户与语音助手交互时,自动语音识别(ASR)模型先将语音转为文本,再由自然语言理解(NLU)模型解析文本结构。 传统ASR系统采用流水线架构,而端到端模型虽更紧凑,但受限于训练数据规模,对罕见词识别效果欠佳。

    22200编辑于 2025-08-06
  • 来自专栏技术趋势

    语音识别ASR和NLP有什么区别?

    背景 语音识别中有两种技术分别是ASR和NLP,ASP是将语音识别转换成文本的技术,而NLP是自然语言,是理解和处理文本的过程,相当于解析器。 ASR是什么? ASR是指自动语音识别技术(Automatic Speech Recognition),是一种将人的语音转换为文本的技术。---来源网络 NLP是什么? ---来源网络 个人理解:ASR很好理解就是将语音转成文字的技术,而NLP则较为复杂,除了要翻译成文字外,还要去翻译成机器能够读懂的语言或指令,让机器接下去的流程,比如 我话了一句查下天气预报,这时候通地 ASR可以直接翻译成文本,而NLP则不仅可以翻译成文本还可以将翻译好的内容转换成具体手机要执行的指令或执行流程,所以NLP比ASR复杂很多。 参考: https://www.zhihu.com/question/268880016 https://baike.baidu.com/item/ASR/23455080?

    1.4K10编辑于 2022-03-29
  • 来自专栏Goboy

    腾讯云语音识别(ASR)助力智慧园区落地

    此外,腾讯云ASR还自研了多模态融合算法、蒸馏算法等,以提升识别性能,并支持热词增强版、ASR情绪识别等功能。 通用语音识别:腾讯云通用ASR引擎。大模型语音识别:腾讯全新上线ASR大模型,在全行业数据集上的识别准确率极大提升。支持的语种类别请前往 控制台 查看。 腾讯云ASR服务:通过API接口与腾讯云语音识别服务连接,将录音数据上传并请求识别结果。后端控制:后端服务器接收ASR服务的识别结果,并根据指令控制智慧园区的大屏幕显示内容。 处理后的录音数据通过API上传至腾讯云ASR服务。ASR服务识别出文字内容后,将结果返回给后端服务器。后端服务器解析识别结果,并根据预设的规则或机器学习模型确定如何操控大屏幕。 .AsrClient;import com.tencentcloudapi.asr.v20190614.models.SentenceRecognitionRequest;import com.tencentcloudapi.asr.v20190614

    2.8K21编辑于 2024-05-25
  • 来自专栏AI技术体系搭建过程

    数字人关键技术1: ASR自动语音识别

    无论是智能音箱、语音助手,还是电话客服和会议转写,自动语音识别(ASR)技术都扮演着重要角色。本文将带你全面了解ASR的基本概念、技术原理、主流开源框架以及实用商用服务,助你快速掌握这项关键技术。 什么是ASRASR,英文全称Automatic Speech Recognition,中文称为自动语音识别。简单来说,它就是让电脑“听懂”人类语言的技术,能够将语音信号实时或离线转成对应的文字信息。 ASR是语音交互、智能助理、语音搜索、无障碍辅助等应用的核心基础。 ASR的技术原理ASR系统一般包含以下几个关键模块:(1) 声学模型(Acoustic Model) 将输入的音频信号转换成声学单元(如音素)的概率分布。 无论你是技术研发者,还是产品经理,理解ASR的工作原理和生态,为开发和选型提供坚实基础。开源工具和云服务让ASR变得触手可及,快速试水或深度开发均有良好选择。

    1.4K21编辑于 2025-09-15
  • 来自专栏腾讯云TI平台

    AI Talk | 语音识别ASR幕后神器-模方平台

    作者:jingtianli ASR 作为机器学习的基础应用之一,已成为众多业务支撑的基础能力,在录音质检、音频字幕、会议转写、语音输入等场景中发挥越来越大的作用。 腾讯云 ASR 作为业界领先的语音识别服务提供商,为开发者提供语音转文字服务的最佳体验,具备识别准确率高、接入便捷、性能稳定等特点。 团队调研现有其他评测平台的基础上,结合云 ASR 服务的类型和特点,开发了一站式的 ASR 模型评测系统——模方平台。 以微信智聆实验室的模型为例,ASR模型包含四个组件:识别环境、VAD 环境、话者分离环境和后处理环境。  ASR 服务种类和性能指标如下: ASR服务类型 指标 录音识别 24小时转码时长 一句话识别 最大并发数、可用性 实时语音识别 并发路数、尾包延迟、VAD时延、首字时延 以上是模型评测报告的指标。

    2.6K30发布于 2021-10-09
  • 来自专栏FreeSWITCH中文社区

    如何使用XSwitch内置的离线ASR及TTS

    在如何在XSwitch中使用ASR及TTS中提到,XSwitch内置了很多ASR/TTS模块,但大多数的ASR/TTS服务都是云厂商提供的。 使用AI模块,8k语音模型asr:ai:vosk-model-cn-0.1 # 使用AI模块,FreeSWITCH兼容模式,8k语音模型 XCC中,不需要asr:前缀,用起来更高效。 asr ASR Interface:是一个XCC ASR的包装器,通过使用asr:your-xcc-asr-interface-name可以将XCC ASR包装成系统原生接口使用。 asr-result-fire-json-event:发送JSON事件,可以使用JSON Event Channel订阅ai_asr主题获取事件。 asr ASR Interface实现了一个包装器,通过JSON Event Channel与XCC ASR Interface通信。主题格式为:ai_asr.

    3.4K20编辑于 2022-12-12
  • 腾讯云ASR产品识别COS资源的方案

    使用场景:腾讯云asr产品可以识别语音文件官方文档:https://cloud.tencent.com/document/product/1093/37823本接口支持音频 URL 、本地音频文件两种请求方式

    64900编辑于 2025-02-24
  • 来自专栏物联网思考

    LoRa终端设备ASR6505普通GPIO操作

    前言:ASR6505是基于STM8L和SX1262的SIP封装,因此操作ASR6505的GPIO实质上就是STM8L的GPIO,因此可以直接使用STM8的标准库,也可以使用SDK提供的API来操作GPIO 普通GPIO说明 ASR6505引出了5个引脚作为普通GPIO,其中GPIO0用作射频开关控制、GPIO1用作NSS控制引脚,因此可二次开发的只剩下3个,与STM8对应关系如下: ASR6505 代码实现 periph_gpio.h/c部分代码: #define ASR6505_GPIO2 PC_4 #define ASR6505_GPIO3 PE_6 #define ASR6505 PE 主函数部分代码: void main( void ) { BoardInitMcu( ); BoardInitPeriph( ); printf("ASR6505

    1.3K40发布于 2020-09-27
领券