WenetSpeech
10000小时的中文语音识别数据集
该数据集是一个10000+小时多领域中文语音识别语料库,所有数据均来自 YouTube 和 Podcast。采用光学字符识别 (OCR) 和自动语音识别 (ASR) 技术分别标记每个 YouTube 和 Podcast 录音。为了提高语料库的质量,作者使用一种新颖的端到端标签错误检测方法来进一步验证和过滤数据。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货