2017年7月
北京希尔贝壳科技有限公司(AISHELL)在Kaldi平台上开源178小时中文普通话数据库(AISHELL-1),同时以aishell命名的recipe项目merge到kaldi里。
数据下载地址:
http://www.openslr.org/33/
recipe地址:
https://github.com/kaldi-asr/kaldi/tree/master/egs/aishell/s5
详情:
http://www.aishelltech.com/kysjcp
2017年12月
aishell的recipe更新添加了说话人识别到kaldi。
recipe地址:
https://github.com/kaldi-asr/kaldi/tree/master/egs/aishell/v1
AISHELL-2
一年过去了AISHELL和AISHELL Foundation的伙伴们再次刷新历史,大家期盼已久的AISHELL-2来了,数据规模达到1000小时和更优秀的系统级recipe,同时,也成为目前全球最大中文开源数据库。
数据以硬盘和网盘形式免费开放给高校科研教育机构。
AISHELL-2还配备了一套evaluation数据集,TEST&DEV数据包含了iOS、Android、高保真Mic三种设备,使实验测试更科学和多样性。
1000小时的数据详情:
recipe地址:
https://github.com/kaldi-asr/kaldi/tree/master/egs/aishell2
AISHELL-2实验的训练集,开发集,测试集构成。具体分配如下:
AISHELL-2 data:
- Sampling Rate : 16kHz
- Sample Format : 16bit
- Environment : Indoor
- Speech Data Type : PCM
- Channel Number : 1
- Recording Equipment : iOS
- Time : 1000 hours of speech data (around 1 million utterances)
- Speaker : 1991 speakers (845 male and 1146 female)
语音识别系统完全使用kaldi来训练和识别,测试结果如下:
数据获取方式:
领取专属 10元无门槛券
私享最新 技术干货