开发者社区

文档建议反馈控制台

技术百科

搜索技术百科

技术百科

发布

技术百科首页 >语音识别 >录音两个人说话，且录音存储成单声道，识别结果是否把两人的对话分离开？

录音两个人说话，且录音存储成单声道，识别结果是否把两人的对话分离开？

修改于 2023-08-31 18:15:56

222

词条归属：语音识别

8K、16K采样率普通话录音文件识别支持单通道双人对话的说话人分离。

相关文章

专访 | Recurrent AI：呼叫系统的「变废为宝」

NLP技术语音识别

自然语言处理是一个庞大的领域，比如普通文本与对话就是两个不同的领域，对话领域里，任务型对话又不同于闲聊型对话，问答式对话又不同于协作型对话……

2018-12-21

1.2K0

Android多媒体之认识声音、录音与播放(PCM)

xml masking png 音频

一、对声音的简单认识 1、模拟信号[摘录于此] 模拟信号传输过程中就是利用传感器把各种自然界各种连续的信号转换为几乎一模一样的电信号。比如说话声音，原本是声带的震动。经过麦克风的采集，将声波信号转换

张风捷特烈

2019-01-07

4.1K1

语音识别基础学习与录音笔实时转写测试

语音识别 NLP技术文件存储 sdk https

小编所在项目中，C1、C1Pro、C1Max录音笔，通过BLE和APP连接，音频文件实时传输到录音助手App端，具备实时录音转写的功能。工欲善其事必先利其器，小编补习了语音识别相关基础知识，对所测试应用的实时转写业务逻辑有了更深的认识。希望对语音测试的小伙伴们也有所帮助~~(●—●)

2020-11-02

4K0

Interspeech 20周年，ASR和SD相关论文提前看

神经网络机器学习深度学习人工智能语音识别

INTERSPEECH 是语音科学和技术领域最大、最全面的国际学术会议。INTERSPEECH 2019 将在奥地利第二大城市格拉茨（Graz）举办。在 INTERSPEECH 会议期间，来自全球学术界和产业界的研究人员齐聚一堂，讨论语音领域的新技术，包括语音合成、语音识别、语音增强这些细分领域。在会议上展示的研究成果代表着语音相关领域的最新研究水平和未来的发展趋势。恰逢 INTERSPEECH 20 周年，主办方透露在会议日程上将会出现一些别出心裁的设计，即将参会的同行们可以期待一下。

2019-09-17

1.1K0

【语音识别】一键实现电话录音转word文档

媒体 AI 语音识别 word 玩转腾讯云语音 python

因从事律师工作，在诉讼业务中，经常会解除到当事人电话录音这一类的证据。苦于当事人提供的电话录音要么普通话不标准，要么直接就是方言，对话中的关键信息也难以定位。而在法庭的质证环节中，仅提交一份电话录音的文件，却不提供转写的文字版内容，显然是不会留给审判席人员好印象的。众所周知，律师最值钱的就是时间了，那么这样一份繁琐的转写录音文件的工作流程，能不能够使用AI的科技手段实现呢？

2024-06-03

2.5K0

点击加载更多

词条知识树 45个知识点

服务与计费相关(5个知识点)
功能相关(22个知识点)
API 与 SDK 相关(4个知识点)
其他相关(6个知识点)
识别效果问题排查(1个知识点)
产品介绍(7个知识点)