前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >语音识别WAV To String

语音识别WAV To String

作者头像
冰封一夏
发布于 2019-09-11 07:29:54
发布于 2019-09-11 07:29:54
13K20
代码可运行
举报
运行总次数:0
代码可运行

由于项目需要在网上找了好多,修改下,下面是个样例,大家看下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 1 using System;
 2 using System.Collections.Generic;
 3 using System.Text;
 4 using DotNetSpeech;
 5 using System.Threading;
 6 
 7 namespace TestSpRecognize
 8 {
 9     class Program
10     {
11         static void Main(string[] args)
12         {
13             WavToCaption obj = new WavToCaption();
14             obj.openWAV();
15         }
16     }
17     class WavToCaption
18     {
19         private SpInProcRecoContext m_wavRecoContext;
20         private ISpeechRecoGrammar m_Grammar;
21         private SpFileStream m_infile;
22 
23         public WavToCaption()
24         {
25             SpInprocRecognizer recognizer = new SpInprocRecognizer();
26             m_wavRecoContext = (SpInProcRecoContext)recognizer.CreateRecoContext();
27             m_wavRecoContext.RetainedAudio = SpeechRetainedAudioOptions.SRAORetainAudio;
28             m_infile = new SpFileStreamClass();
29             m_infile.Format.GetWaveFormatEx();
30         }
31 
32         public void openWAV()
33         {
34             m_Grammar = m_wavRecoContext.CreateGrammar(0);
35             m_Grammar.DictationLoad("", SpeechLoadOption.SLOStatic);
36 
37             //register an event handler everytime the engine recognizes something from teh file
38             m_wavRecoContext.Recognition += new _ISpeechRecoContextEvents_RecognitionEventHandler(RecoContext_Recognition);
39 
40 
41             //register an event handler when the engine is done reading the  file
42             m_wavRecoContext.EndStream += new _ISpeechRecoContextEvents_EndStreamEventHandler(RecoContext_EndRecognition);
43 
44             //try to open the file
45             try
46             {
47                 m_infile.Open(@"c:\1.wav",
48                 SpeechStreamFileMode.SSFMOpenForRead, false);
49                 Console.Out.WriteLine("Succesfully opened file");
50             }
51             catch (Exception e)
52             {
53                 Console.Out.Write("Could not find file");
54                 return;
55             }
56 
57             //this makes it so the engine recognizes we're reading in from a  wav, vs. a microphone
58             m_wavRecoContext.Recognizer.AudioInputStream = m_infile;
59 
60             //starts reading the file here
61             m_Grammar.DictationSetState(SpeechRuleState.SGDSActive);
62             Console.ReadKey();
63 
64         }
65 
66         void RecoContext_Recognition(int StreamNumber, object StreamPosition, SpeechRecognitionType RecognitionType, ISpeechRecoResult Result)
67         {
68             //Result.PhraseInfo.GetText(0, -1, true);
69             Console.Out.Write("recognized something");
70             Console.ReadKey();
71         }
72 
73         void RecoContext_EndRecognition(int StreamNumber, object StreamPosition, bool f)
74         {
75             m_infile.Close();
76             m_Grammar.DictationSetState(SpeechRuleState.SGDSInactive);
77 
78         }
79 
80 
81     }

这个是测试可用的

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2013-01-10 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
2 条评论
热度
最新
请问错词率大概多少
请问错词率大概多少
回复回复点赞举报
识别的结果在哪?
识别的结果在哪?
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
c#语音识别(wav to text)
最近在搞一个语音识别的项目,wav to 文字,一开始写的代码在使用多线程的时候会出现识别超时的现象,不过后来终于google到解决方法。下面给出代码,不过遗憾的是资源释放不完全,希望给位给点建议。
冰封一夏
2019/09/10
1.7K0
语音识别 | Java 实现 AI 人工智能技术 - 语音识别功能
说到语音识别、语音翻译、图像识别、人脸识别等等,现在已经非常非常非常普及了,看过‘最强大脑’的朋友,也应该对‘小度’这个机器人有所了解,战胜国际顶尖的‘大脑’- 水哥,(PS:内幕不知),那么今天,我们来看下关于语音识别,是如何做到的,Java又是如何识别语音的?如何转换语音?
码神联盟
2018/07/30
8K0
语音识别 |  Java 实现 AI 人工智能技术 - 语音识别功能
Windows 10 IoT Serials 5 - 如何为树莓派应用程序添加语音识别与交互功能
    都说语音是人机交互的重要手段,虽然个人觉得在大庭广众之下,对着手机发号施令会显得有些尴尬。但是在资源受限的物联网应用场景下(无法外接鼠标键盘显示器),如果能够通过语音来控制设备,与设备进行交互,那还是很实用的。继上一篇《Windows 10 IoT Serials 4 - 如何在树莓派上使用Cortana语音助手》之后,本文将详细讲述如何为运行Windows 10 IoT Core系统的树莓派添加语音识别和语音交互功能。 1. 硬件准备 树莓派2/树莓派3、5V/2A电源、TF卡(8GB以上) 麦克
ShiJiong
2018/01/10
1.3K0
Windows 10 IoT Serials 5 - 如何为树莓派应用程序添加语音识别与交互功能
【python的魅力】:教你如何用几行代码实现文本语音识别
语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字和文字转换为语音。
爱喝兽奶的熊孩子
2024/05/05
1.1K0
【python的魅力】:教你如何用几行代码实现文本语音识别
python语音识别终极指南
译者 | 廉洁 编辑 | 明明 【AI科技大本营导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到: •语音识别的工作原理; •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。
AI科技大本营
2018/04/26
4.6K0
python语音识别终极指南
花样试用微软语音服务晓晓
受微软美女员工 Grace Peng 邀请(也可能是套路???),参加微软神经语音(没错,就是神经)晓晓的试用,首先是看到了群里面的消息,然后就是发送申请,等待回复,过了几天后,收到了一个机器人发来的账号密码,告诉我已经帮我申请了免费试用的账号,直接登录即可使用了。其实一直都有接触各种 TTS 的服务,但是在测试微软晓晓的过程中发现,在拟人方面,晓晓的发音似乎被训练得很不错,在语法方面,晓晓支持 SSML 语法,具体参见:https://www.w3.org/TR/speech-synthesis/ 什么是 SSML,来自百度百科 语音合成标记语言 的解释。
梁规晓
2019/04/22
5.7K0
花样试用微软语音服务晓晓
深入分析委托与事件—C#综合揭秘——细说多线程
本篇文章将为你介绍一下 Delegate 的使用方式,逐渐揭开 C# 当中事件(Event)的由来,它能使处理委托类型的过程变得更加简单。 还将为您解释委托的协变与逆变,以及如何使用 Delegate 使 Observer(观察者)模式的使用变得更加简单。 在事件的介绍上,会讲述事件的使用方式,并以ASP.NET的用户控件为例子,介绍一下自定义事件的使用。 最后一节,将介绍Predicate<T>、Action<T>、Func<T,TResult>多种泛型委托的使用和Lambda的发展过程与其使用方式。 因为时间仓促,文中有错误的地方敬请点评。
vv彭
2021/01/06
2.2K0
Unity 接入科大讯飞语音识别及语音合成
首先需要到科大讯飞官网开发者控制台创建一个应用,创建成功后获得服务接口认证信息,我们只需用到其中的AppID。
CoderZ
2022/08/29
3.8K1
Unity 接入科大讯飞语音识别及语音合成
腾讯云语音识别之一句话识别
一句话识别API地址:https://cloud.tencent.com/document/product/1093/35646
HI hero
2020/07/26
2.4K0
腾讯云语音识别之一句话识别
C# 语言程序设计笔记
C#是一种最新的、面向对象的编程语言。它使得程序员可以快速地编写各种基于Microsoft .NET平台的应用程序,Microsoft .NET提供了一系列的工具和服务来最大程度地开发利用计算与通讯领域。他是从C和C++派生而来的,其与C/C++语法非常相似,并依附于.NET虚拟机的强大类库支持,各方面对强于C/C++.
王 瑞
2022/12/28
4K0
■ Android集成百度语音识别
实现这个功能的目的,是我看见我公司硬件工程师给客户回答问题的时候用公司研发的APP,每次都是手动输入打字,看着他带着老花镜的样子,于心不忍,毕竟咱就是干这个的.
全栈程序员站长
2021/04/07
7930
百度语音识别api使用python进行调用
百度语音现在是比较方便的接口,具体说明请看官方文档,本文分两个部分,先是使用python实现录音,然后再使用百度语音api进行识别上传。
十四君
2019/11/28
1.9K0
百度语音识别api使用python进行调用
腾讯云语音识别iOS SDK 开发代码模块分析
以使用 iOS SDK 方式接入,以一句话识别为例,展开对官当demo代码模块的分析。
Aalto
2020/04/03
3.3K0
离线环境的中文语音识别 paddlepaddle 与 Speech_Recognition(Sphinx)实践
本文主要针对中文语音识别问题,选用常用的模型进行 离线 demo 搭建及实践说明。
流川疯
2021/12/06
9.2K0
离线环境的中文语音识别 paddlepaddle 与 Speech_Recognition(Sphinx)实践
腾讯云语音识别之录音文件识别
录音文件识别API介绍地址:https://cloud.tencent.com/document/product/1093/37822
HI hero
2020/07/15
9.9K0
腾讯云语音识别之录音文件识别
Android开发笔记(一百零八)智能语音
如今越来越多的app用到了语音播报功能,例如地图导航、天气预报、文字阅读、口语训练等等。语音技术主要分两块,一块是语音转文字,即语音识别;另一块是文字转语音,即语音合成。 对中文来说,和语音播报相关的一个技术是汉字转拼音,想想看,拼音本身就是音节拼读的标记,每个音节对应一段音频,那么一句的拼音便能用一连串的音频流合成而来。汉字转拼音的说明参见《Android开发笔记(八十三)多语言支持》。 语音合成通常也简称为TTS,即TextToSpeech(从文本到语言)。语音合成技术把文字智能地转化为自然语音流,当然为了避免机械合成的呆板和停顿感,语音引擎还得对语音流进行平滑处理,确保输出的语音音律流畅、感觉自然。
aqi00
2019/01/18
5.8K1
C# 代码占用的空间
是不是代码会占用空间,如果一个程序初始化需要 100M 的代码,那么在他初始化之后,这些代码就没有作用了,他会不会占空间?本文经过测试发现,代码也是会占空间。
林德熙
2018/09/18
8210
C# 代码占用的空间
C2第 1 节值类型引用类型介绍和字符串练习
C2第3节ref和out、装箱与拆箱 1、使用ref型参数时,传入的参数必须先被初始化。对out而言,必须在方法中对其完成初始化。 2、使用ref和out时,在方法的参数和执行方法时,都要加ref或out关键字。以满足匹配。 3、out适合用在需要retrun多个返回值的地方,而ref则用在需要被调用的方法修改调用者的引用的时候。 装箱拆箱
静心物语313
2020/03/24
4860
百度语音识别pom引入jar工具类
pom引入jar <!--mp3转pcm--> <dependency> <groupId>com.googlecode.soundlibs</groupId> <ar
用户5899361
2020/12/07
1K0
C# 委托进阶
本文参考自:https://wenku.baidu.com/view/41ab91d3c1c708a1284a44d7.html?qq-pf-to=pcqq.c2c 1、为什么委托定义的返回值通常为v
郑小超.
2018/01/26
9330
相关推荐
c#语音识别(wav to text)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验