我目前正在开发一个应用程序,它可以让心理学家管理他们的时间表和预算。作为概念证明,我想创建一个智能预约服务。可能有3种情况:
I know the client, I need to guess the day and time for his next appointment
I know the day, I need to guess which client and at what time
I know nothing, I need to guess which client, which day and what time
我目前正在学习深度学习算法,只是为了获得一点理论知识,但
是否有可能有不同的行为时,玻璃器皿是通过"OK玻璃“语音命令和触摸菜单选择?特别是,如果玻璃器皿是用"OK玻璃“语音命令启动的,我们将提示语音识别,否则,如果从触摸菜单中启动,则直接转到玻璃器皿。或者,有什么方法可以让应用程序知道它是以哪种方式发布的?我们正试图模仿Google Play Music Glassware所做的。
我正在开发一个iOS text to speech应用程序,并试图添加一个使用亚历克斯语音的选项,这是iOS 9的新功能。我需要确定用户是否已经在设置->辅助功能中下载了亚历克斯语音。我似乎不知道该怎么做。
if ([AVSpeechSynthesisVoice voiceWithIdentifier:AVSpeechSynthesisVoiceIdentifierAlex] == "Not Found" ) {
// Do something...
}
原因是其他语言的声音是标准的,以一定的速率播放,与Alex的声音不同。所以我有一个可以工作的应用程序,但是如果
我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature