我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature
我在Ruby on Rails应用程序中遇到了一个小问题。你看,我有通信,一个用户可以向另一个用户发送消息,依此类推。但是有一个回复,当原始文本被获取时,在文本字段中的每一行的乞求上应该有">“(我在这个文本字段中使用ckeditor ),这有助于我在显示时将块引用放在那里。因此,示例如下:
我收到的原始消息如下:
hi there,
howareyouhowareyouhowareyouhowareyouhowareyou howareyou howareyou howareyouhowareyouhowareyouhowareyou howareyou howareyou h
所以我要做的是复制这个效果(这可以用铬45.0.2454.101米看到)。需要注意的是,每个div都在包装器中显示一个整体背景图像(但实际上它是一个相同大小的单独图像,通过倒置颜色来修改,这样您就可以看到差异)。
基本上,似乎每个内容div都在使用一个背景图像,即文档本身的大小。
结构:
<div class="wrapper">
<div class="content">
Here is some content
</div>
<div class="content