我正在开发一个使用语音识别的IOS应用程序。因为现有技术在识别单个字母(随机的,非拼写的)方面不提供良好的准确性。
我在考虑使用一组单词,每个字母一个,然后识别这些单词(这可以极大地提高准确性)。
例如,在意大利,它被广泛使用一组城市名称(用于拼写):
A - Ancona
B - Bari
C - Como
... and so on
我的问题是,一个普通的美国人,会用什么词??
例如,它是北约字母表吗?或者是否有另外一个或多个集合(我总是可以使用mix)。我唯一不能做的事情就是使用完整的英语语料库;)
提前谢谢你,
我正在尝试为僧伽罗语语言创建一个语音识别系统。我试图创建一个语言模型,但是按照 .I中的答案,在windows.My输入文件中使用了在线lmtool和csmlmtk-0.7-win32,如下所示,
එක eka
දෙක de ka
තුන thu na
හතර ha tha ra
පහ pa ha
හය ha iya
හත ha tha
අට ah ta
නවය na wa ya
在向lmtool和cmuclmtk提交后,我得到了如下输出:
AHTA AE T AH
DEKA D AH K AA
EKA EH K AH
HAIYA HH EY AY AH
HATHA
nltk包的内置语音标记似乎没有针对我的用例()进行优化。显示它使用了一个名为maxent_treebank_pos_tagger的保存的、经过预先训练的分类器。
是什么创造了maxent_treebank_pos_tagger/english.pickle?我猜外面有一个标记语料库,用来训练这个标记者,所以我想我正在寻找(a)标记语料库和(b)基于标记语料库训练标记者的确切代码。
除了大量的googling之外,到目前为止,我试图直接查看.pickle对象,以找到它内部的任何线索,从下面开始
from nltk.data import load
x = load("nltk_data
我有一个语料库,我需要计算整个语料库中的文档和标记的数量,以及它的子部分。
到目前为止,我开发的代码如下所示:
def gather_data(path):
words = 0
articles = 0
for root, dirs, files in os.walk(path):
for f in files:
if not f.endswith('_metadata.txt') and f.endswith('.txt'):
articles += 1
我正在制作一个语音识别系统,Julius在这项工作中展示了不错的结果。示例.voca文件中的单词可以很好地识别,但是如何将自己的单词和抄本放到文件中呢?
我已经尝试了VoxForge ()上一次发布的版本和每晚构建的声学模型的词汇表,但我在julius start上遇到了很多错误,比如:
Error: voca_load_htkdict: line 19: triphone "r-d+v" not found
Error: voca_load_htkdict: line 19: triphone "d-v+aa" not found
Error: voca_lo
我正在做代码转换的研究。我收集了一些带有英语代码开关的双语波兰语文本消息(例如,语料库A)以及一本英语词典(也是一个列表,语料库B)。我想从语料库A中提取语料库B中的所有单词实例-这样我就可以看到哪些英语单词出现在双语语料库中。这是我用来创建这些常用单词列表的代码(它远不优雅,但我是一个新手,所以不要对我太苛刻了,哈哈): intersection=common.intersection(corpusB)
commonlist=list(intersection)
with open("commonlist.txt","w") as z:
pri