我正在解析一个html文件。我有一个很大的字符串,基本上是一个脚本。该字符串如下所示:
var spConfig =新的Product.Config({"outofstock":"12663“、"instock":"12654”、"12655“、"12656”、"12657“、"12658”、"12659“、"12660”、"12661“、"12662”、"12664“、"12665”、“属性”:{“id”:“698”、“代码”:“aubade_import_col
我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature