腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
2
回答
如何在图像上实现手势识别器?
我想在图像上实现所有可能的手势识别器,如 旋转手势识别器 变焦手势识别器 滑动手势识别器和所有可能的手势识别器。 我不知道手势,所以请,如果有人知道的话,那就给我发个主意。
浏览 4
提问于2012-02-21
得票数 3
回答已采纳
3
回答
日本最精确的开源OCR?
、
、
根据您的经验,什么是最准确的开放源码光学字符识别(OCR)库/软件来读取日文文本? 我刚试过nhocr,它的错误率超过2%,即使是在一个非常干净的高清晰度文档上(2%用于大字体的超干净字符,对于扫描过的书籍则更糟糕,更不用说手写形式了)。 日本旧手机(特别是夏普手机)在10年前就有了很好的日本OCR,所以我想它在开源中也是可行的。
浏览 0
提问于2015-02-03
得票数 6
1
回答
根据定义,文本识别是图像识别的一部分吗?
、
、
、
我指的是更先进的文本识别系统,它们使用神经网络从Google和Microsoft在其ML平台上提供的图像中查找和提取文本。 如果不是,与其他图像识别分支,如物体或人脸识别,技术上的区别是什么?
浏览 0
提问于2019-06-18
得票数 0
回答已采纳
1
回答
Azure Devops管道- C++ - Whitesource Bolt
、
、
我有一个项目,在C++写的,并内置到码头的形象。我在我的项目中使用了一些开源库(nlohmann json,gtest,cpr等)。 现在,我正在尝试使用Whitesource Bolt查找开源漏洞。我向Azure管道任务添加了扩展。 我想知道,Whitesource Bolt如何识别这些开源模块中的漏洞。我读到了,他们会创建一个数字签名,并与他们的数据库进行比较。 但是,谁能描述一下他们是如何创建数字签名的,或者他们是如何在我们的代码中识别开源模块的?
浏览 0
提问于2021-02-15
得票数 1
1
回答
Microsoft语音识别默认值与API
、
、
、
因此,我一直在Windows10中使用微软语音识别,做训练练习,将文本口述到写字板中并进行更正,向字典中添加单词等等。我想用这个软件来转录.wav文件。似乎可以使用Windows语音识别API来做到这一点,但这似乎涉及到创建和加载自己的语法文件,这向我表明,这基本上将创建一个新的语音识别器,它使用相同的构建块,但与我在开始菜单中单击“开始语音识别”时运行的程序不同。特别是,由于训练或配置的不同,它的性能会有所不同。 这一点我说错了吗?如果不是,是否还有一种方法可以检索默认语音识别器使用的所有数据,以便我可以准确地再现它的行为?如果我需要创建一个单独的语音识别器,它有自己的语法文件和单独的训练历
浏览 5
提问于2016-03-18
得票数 1
1
回答
Android图像识别
、
我对Android上的图像识别有一个特别的问题。我正在寻找一些图书馆能够识别几个对象从一张照片。例如,给定一张用户拍摄的照片,我如何计算有多少红色圆圈和黄色三角形?这些形状只是一个例子,因为我想识别非常简单的图像。我已经看到有一个很好的框架叫做Vuforia,它是为增强现实而设计的。你觉得它对我合适吗?我不是专家,所以我请求你帮助我。
浏览 0
提问于2013-10-01
得票数 3
1
回答
文本的光学识别及其结构分析(标题、副标题、正文)
、
、
、
、
我们希望分析具有不同语言的文本(非手写)和具有非常广泛的排列/结构范围的图像的文档扫描。我们要解决的第一个问题是提取文本,并识别和分离标题、字幕和正文。 目前我们正在做文献研究。有大量关于深度学习、计算机视觉、光学字符识别或自然语言处理的文献,但这些文献都没有真正专注于文本结构的光学识别。 我们想知道,处理文本结构的光学识别的学科/领域的名称是什么? 解决这些问题的最先进的方法和工具是什么?
浏览 19
提问于2020-09-01
得票数 0
回答已采纳
1
回答
我需要WPF的OCR
、
、
、
我需要光学字符识别组件的InkCanvas控制,以便我可以识别字符,并取代手写一个好的从光学字符识别?
浏览 4
提问于2011-04-12
得票数 2
2
回答
有没有用Delphi做的开源文字处理器?
、
如果你知道一个,我很想了解一下。 谢谢,一如既往--阿尔·C。
浏览 3
提问于2009-09-21
得票数 2
4
回答
基于iPhone的语音识别
、
我需要开发一个识别语音的iPhone应用程序,并根据结果执行进一步的任务。 我知道iPhone 3.0不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,我不知道如何处理它。 是指我需要购买哪些软件并在服务器端实现它,以及如何使用该服务??
浏览 2
提问于2009-07-13
得票数 6
2
回答
当文本包含括号时出现问题(可能还有其他特殊字符)
、
我有以下表达式:[^(\r\n)]*来识别任何不包含\r\n的文本。但是,当文本包含(或)时,则无法识别。 示例: "I have following expression to recognize any text."将被确认为OK。 "I have following expression (A) to recognize any text."将不被识别。 因此,我想要全文:"I have following expression (A) to recognize any text."
浏览 1
提问于2012-12-08
得票数 3
回答已采纳
1
回答
用于c++的文字校正库
、
、
c++有没有开放源码的单词校正?我想与我的c++程序集成,以解决当光学字符识别器读取错误的一些字符在一些位置的整个单词。例如,如果光学字符识别输出是"Recoqnitl0n“,程序将纠正它并转换为"Recognition”。 谢谢
浏览 2
提问于2013-01-24
得票数 0
1
回答
文件格式标识
、
、
、
、
有人知道文件格式识别的软件吗?我的意思不是通过文件扩展名来识别,而是通过分析字节流。我感兴趣的是一个开放源码平台来开发。谢谢
浏览 0
提问于2015-03-27
得票数 1
1
回答
我怎么使用腾讯云文字识别?
这个云功能针对程序员?我作为终端用户,怎么能快速进行图片文字识别?
浏览 600
提问于2020-04-23
1
回答
.net中有没有免费的车牌识别软件?
、
、
、
、
.net中有没有免费的车牌识别库或软件? 另外,您能列出.net中提供的免费OCR库和软件吗?
浏览 8
提问于2012-02-13
得票数 3
回答已采纳
1
回答
AWS text_detection()能检测到图像中的中文或其他语言吗?
、
、
、
我刚开始学习巨蟒和机器学习,但我已经开始掌握它了。使用AWS text_detection确实很酷,但我想知道它是否能够检测出英语以外的其他语言。我知道AWS有一个功能来识别文本文件中的主导语言,但是图像文件有识别功能吗?任何帮助都是非常感谢的。
浏览 3
提问于2018-11-25
得票数 0
回答已采纳
1
回答
Android绘制圆圈有8个部分,所有部分都应该是可触摸的
嗨,我需要的代码来创建一个简单的八节圆,所有的节都应该是可点击或可触摸的,我应该能够识别出他触摸了哪一节。 我所做的是通过使用画布我已经通过给出宽度高度来绘制冰球它使用(x,y)的8个点来绘制圆然后我试图通过检查触摸事件x和y指向已经存储的8个固定点的触摸事件x和y来识别他触摸了哪个部分,但是它不工作请帮助我
浏览 0
提问于2014-03-07
得票数 0
8
回答
OCR文字识别技术有哪些应用?
OCR 是实时高效的定位与识别图片中的所有文字信息,返回文字框位置与文字内容。支持多场景、任意版面下整图文字的识别,以及中英文、字母、数字的识别。简单来说就是将图片上的文字内容,智能识别成为可编辑的文本,这么强大的功能在我们生活当中有哪些应用呢?
浏览 3631
提问于2018-08-24
1
回答
java中的手写识别
、
、
、
我希望在我制作的一款软件中使用手写识别和OCR。我想知道是否有人知道任何(最新的)支持OCR或手写识别的软件包。 我正在寻找更多的免费套餐,但我也会对商业套餐感兴趣。 我看过其他一些文章,比如09年的,但我找不到任何看起来合理的文章。 我最好用C#编写代码,并使用Windows7内置的笔迹分析器?
浏览 2
提问于2012-08-09
得票数 1
回答已采纳
2
回答
重复的常量c_strings是否重复?
、
、
、
、
比如说,在我的程序中,我将一个字符串传递给了一个方法。 someMethod("hello World"); 在编译时,我假设文字"Hello world“被识别为常量,而不是直接声明它。 如果它将其识别为常量,是否将重复的地址存储为相同的地址? 更确切地说,是c++11吗? 因此,让我们有一个案例场景,假设我用一个Object to String列表填充了一个映射。 map<std::string,Shader> list; list["shaders/sprite.vs"] = Shader("shaders/sprite.vs&
浏览 0
提问于2017-05-26
得票数 1
2
回答
寻找适用于android的ANPR/LPR (自动车牌识别/车牌识别) SDK
、
、
、
我正在寻找android..Is (自动车牌识别/车牌识别)软件开发工具包,有适用于安卓系统的软件开发工具包吗? 我想为android开发一个车牌识别软件,用户可以使用手机摄像头扫描车牌并识别车牌号码。 我尝试了一些光学字符识别(OCR)引擎,如Tesseract,但准确性太差了。 除了OCR,还有其他方法可以使用吗?
浏览 23
提问于2013-05-16
得票数 6
回答已采纳
1
回答
Google语音识别时间戳
、
我有一个音频文件,而且我有那个音频文件的准确记录。我希望能够在这个特定的文字记录中得到每个单词的时间戳。 我不想要不准确的演讲的时间戳。我已经可以这样做了,这是有用的,但由于语音识别中的错误,它还不够好。 有没有人知道谷歌语音识别是否有可能做到这一点?
浏览 3
提问于2020-04-25
得票数 1
1
回答
文字识别,音标是硬伤?
文字识别,音标是硬伤。发个结果比较图,希望有助于提高识别率。 Screen Shot 2019-05-13 at 17.41.11.png 汉字 一 大写英文 I
浏览 441
提问于2019-05-13
4
回答
中文手写识别
、
、
我正在寻找手写识别解决方案。我找到了一个,它是一个flash应用程序。它的工作原理是什么?是否对db进行任何查询以查找该字符?
浏览 1
提问于2009-11-16
得票数 5
回答已采纳
1
回答
Alt键在Ubuntu22.04(瑞典键盘)上未被识别
、
、
我刚刚在Virtual上安装了Ubuntu22.04,我的Alt没有被识别。我使用的是瑞典键盘,这特别痛苦,因为我不能写“@”,例如。我尝试将布局更改为US,但关键仍然未被识别。我也尝试用不同的物理键盘,问题是一样的。 有什么线索吗?我该怎么解决?
浏览 0
提问于2022-08-31
得票数 0
1
回答
Apple创建定制VNImageBasedRequest
、
、
、
我一直在玩苹果的CoreML和Vision。 我的目标是对概念做一个简单的证明,并能够识别手绘上的钉子。这是非常具体的。 我一直试图找到关于如何创建您自己的VNRequest的文档,而我真的不知道如何做到这一点。 我知道视觉API只提供矩形,人脸和文本识别. 我如何才能提出我自己的要求,教视觉如何识别我想要的图片?
浏览 0
提问于2018-11-20
得票数 0
回答已采纳
2
回答
是否有任何方法来改变来电者的声音,使声音识别不可能?
、
、
我搜索并找到了这篇文章: 是否可以用语音识别来识别手机用户? 然而,它并没有回答我的问题。 是否有任何方法改变一个人的声音,足以使手机呼叫无法识别的语音识别技术?
浏览 0
提问于2019-08-29
得票数 2
2
回答
带有android应用程序的OCR
、
我想要创建一个应用程序,在那里人们可以拍摄任何文本和应用程序识别文本,复制它并将它放在一个可编辑的区域。 课文的语言不重要。我只想自动识别这些字符。后面的一个功能可以是提供文本翻译。 有用于android应用的ocr库吗?据我所知,google想为ocr提供一个api (我在2011年获得的关于它的最新信息)。就像它似乎还没有api。
浏览 1
提问于2015-04-27
得票数 1
回答已采纳
2
回答
Regex用于识别德语、中文和日语
我想使用正则表达式来识别文本是中文、日文还是德文。 例如,我有一些类似于"MainWindow_Button_save“的文本。 它的德语翻译是"MainWindow_Button_sparen“。 它的中文翻译是"MainWindow_Button_保存“。 日语是"MainWindow_Button_保存“。 我想要一个正则表达式,它可以找到前缀"MainWindow_Button,并确定下面的文本是否为中文/日文/德文。我不太关心这篇文章。我唯一关心的是它是用哪种语言编写的。 我所做的就是这个"^MainWindow_Button_[^a-
浏览 6
提问于2014-09-30
得票数 1
2
回答
在Python2.7.5中使用os.path.getsize()获取文件大小
、
、
我是python的新手。我正在尝试使用os.path.getsize()来获取文件大小。但是,如果文件名不是英语,而是中文、Gemany或法语等,Python将无法识别它,并且不会返回文件的大小。你能帮我搬一下吗?如何让Python识别文件名并返回这类文件的大小? 例如:文件名为:Показателиестественногоимиграционногоприростадо2030г.doc Path=“C:\xxxx\Показателиестественногоимиграционногоприростадо2030г.doc” 我想用“os.path.getsize(path)” 但是它
浏览 2
提问于2013-07-02
得票数 0
2
回答
java中的指纹识别
、
如何在没有任何指纹识别设备的情况下用java做一个指纹识别程序,通过使用指纹image.Please来帮助我。
浏览 3
提问于2011-03-14
得票数 2
1
回答
有什么建议如何实现字符识别功能吗?
、
让用户在画布上写/画一个字符,并识别它。 看起来并不那么容易,有没有一个开源项目来解决这个问题呢?
浏览 0
提问于2010-03-12
得票数 1
回答已采纳
3
回答
如何识别C#中的"\“字符
我只想在控制台上写这个"\“。 Console.Write("\"); 但它不像字符串或字符那样识别它,而是作为命令识别它。
浏览 4
提问于2017-02-27
得票数 0
回答已采纳
1
回答
如何在c#中将语音转换为文本?(不使用任何sdk或System.speech.*)
、
我知道这不是关于这个话题的第一条帖子,但是我已经搜索了所有关于这个话题的帖子,没有找到我想要的东西。我正在做毕业设计,语音识别也是其中的一部分。我已经搜索了很多关于它,并发现了不同的SDK是可用的,甚至语音识别器引擎在c#。我不能包括这些代码,我得从头开始在我的密码上试一试。 现在,我已经能够从麦克风中获取语音输入,并将其存储到一个wave文件中。我希望将相同的文件或字节流传递给语音识别,以便将语音转换为文本。 如果有人已经这样做了,并且能给我一个论文的链接或者一个代码,我会真的很感激。 ,提前谢谢!
浏览 3
提问于2012-03-04
得票数 0
回答已采纳
6
回答
(c/c++)字符串文本的副本是否共享文本部分的内存?
、
、
如果我在程序中多次调用像myObj.setType( "fluid“);这样的函数,那么在内存中保存了多少个文本”fluid“的副本?编译器能识别出这个文字已经被定义并再次引用它吗?
浏览 0
提问于2009-12-09
得票数 1
回答已采纳
1
回答
扫描/拍摄检查和填充数据的照片
、
、
嘿,我可以用iPhone上的phonegap扫描/拍照支票并识别账号和路由号码吗
浏览 1
提问于2011-02-17
得票数 1
1
回答
有没有开源的android语音识别应用程序?
、
有没有开源的android语音识别应用程序?如果可用,请提供参考资料。
浏览 1
提问于2012-03-05
得票数 0
回答已采纳
1
回答
用于记录已完成会议的语音识别软件
、
我正在寻找语音识别软件,我可以有分析某些音频(S)文件(与用户(S)的声音在其中),标记的声音为用户(本人) x。 这样做的目的是,在开会时,软件识别数据库中的声音,将这些声音标记为用户X、Y和Z,他们所说的一切都将被标记为 "X:我认为我们需要有一种数字化的方式来记录我们的讨论/会议“ "Y:那似乎是个好主意。“ "Z:识别我们的声音并将单词标记为X/Y/Z的人“。
浏览 0
提问于2016-09-13
得票数 1
1
回答
在android中获取微录音的指纹/声纹
、
、
、
、
我正在尝试this...thanks all am是否可行:) 我想做一个应用程序,它可以识别麦克风中的一些音频。现在,我只需要获取指纹(或audioprint,我不知道英文的确切名称^^)。像"sjd78fhwHJsdjsDjwrkf"这样的文本,或者其他类似于音频指纹形状的文本。 我只需要知道如何在android中获取音频的指纹,但在java/android的所有这些音频识别中,我找不到一个简单的解决方案。 感谢所有人,并为我的英语道歉
浏览 2
提问于2012-08-20
得票数 3
回答已采纳
1
回答
Tesseract的替代方案
、
、
、
在Python或OpenCV中,有没有其他软件或库可以替代Tesseract进行字符识别? 有什么建议的字符识别方法可以用Python实现吗? 谢谢
浏览 0
提问于2017-10-23
得票数 4
2
回答
一种有效的录音质量检测方法
、
、
我们有来自我们的服务器端进程之一的实时、不加控制的记录的各种波形文件,而且它们中的大多数在整个过程中都有很好的清晰的语音。然而,有时他们是混乱的,他们有静态,或说话音量不够大。是否有一个有效的方法来确定一个记录是否被认为是“良好”质量使用C#? 我曾想过要把已知的好唱片的平面图和不好的录音进行比较,但是每次录音都会有不同的语言,所以这可能行不通。我研究过像Bass.Net和NAudio这样的库,但是音频处理不是我的专业领域。 我可以尝试比较,但我不完全确定它是如何工作的。我看到有人试图用他们的音频指纹哈希和Levenshtein距离算法来比较两个音频文件,以找到两个音频文件之间的相似度。除非音
浏览 6
提问于2013-08-14
得票数 0
回答已采纳
1
回答
谷歌语音识别是如何工作的?
我知道音频指纹识别音频文件,这是很棒的,但我真正想知道的是Google是如何制作语音识别API的,它们是如何获取音频和返回的单词的。 我写了一个宝石来指纹wav音频文件并对它们进行比较,但是如果我用指纹将我的声音与充满指纹的数据库进行比较,可能要花费很长时间。谷歌是怎么做到的? 用途: 我真的很喜欢语音识别,我想要一个地方开始编码,但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子,所有这些软件都非常快。 我想知道从音频记录到转换成文本的服务器流。
浏览 5
提问于2014-02-27
得票数 0
回答已采纳
1
回答
固定的,小词汇量,语言独立的语音(或命令)识别
、
、
寻找任何低计算复杂度的识别引擎(希望自由和开放源码软件),这是很好的工作: 固定组/小词汇表(最多100个短语) 语言无关 不连续的讲话/命令 如果发动机是: 说话人相关 (因此)需要先验的训练(在进行识别之前) 所谓低计算复杂度,我的意思是,我可以希望运行在450兆赫的ARM9 SBC与64 on内存。
浏览 1
提问于2012-11-19
得票数 2
回答已采纳
2
回答
可以评估人类情绪的工具
、
、
、
我对“机器学习”工具的好奇已经有一段时间了。评估人类行为/情感的工具背后的技术/概念是什么,比如FB或twitter feed。我最近开始学习这种分析方法,并热衷于了解这些是如何做到的。有这样的工具名称吗?有没有开源的东西?谢谢! 我读过这篇,但它只涵盖了人脸和语音识别。
浏览 2
提问于2013-08-08
得票数 2
1
回答
说话人识别在iPhone应用中的应用
、
、
、
、
出于安全考虑,我想使用iPhone应用程序中的语音识别功能来跟踪语音。 每个用户都可以记录他/她的语音,并通过识别他/她的语音打开应用程序,该语音被记录并存储在数据库中。 有没有人对此功能有想法或示例应用程序,以及如何在iPhone应用程序中实现它?
浏览 0
提问于2012-08-28
得票数 2
1
回答
基于神经网络的手写体字符识别
、
、
、
我需要一些指南和帮助发展这个神经网络。我过去没有任何使用神经网络的经验,这对我来说有点困难。我想用这个来识别笔迹.. 任何帮助都会很好.. :-|
浏览 1
提问于2011-06-19
得票数 1
回答已采纳
1
回答
如何调整OpenALPR性能?
、
我在的演示网站上尝试过使用这个图像:,它运行得很好!然后,我在我的Ubuntu系统(16.04)上下载并安装了OpenALPR (2.2.4),并使用了相同的映像,但是在我的系统上,LP根本不被很好地识别,为什么会有这种区别呢? 谢谢! 我没有更改/etc/openalpr/openalpr.conf 结果 () openalpr网站 所有三个可见的LP都被正确地识别、解释和显示: 15451 FRJ7248 DUS4092 我的本地系统上的openalpr (相同图像) 只有DUS4092 LP是正确识别的(当也没有最好的信心分数),其他的根本不被正确识别!: plate
浏览 1
提问于2018-07-16
得票数 0
回答已采纳
1
回答
蔚蓝语翻译:如何激活识别只有当语音被检测到?
、
、
、
、
我目前正在开发一个实时翻译网络应用程序,允许多个参与者使用,并以多种语言分享他们的转录。 我不想被告知参加会议的人数x会议的持续时间。因此,问题是:,当检测到语音时,我如何才能激活识别?这样的话,我只会为目前说话的人付钱。 我尝试使用来自的事件,但只有当识别器当前正在识别时(使用recognizeOnceAsync()或startContinuousRecognitionAsync()),此事件才会触发。 ,在Speech中有什么参数可以用来实现我想要的吗?如果没有,我的选择是什么? 这可能是可能的观看音频dB水平,并激活连续识别相应,但我认为我会遇到一些问题,如果我尝试这样做。例句:一旦音频
浏览 5
提问于2021-02-08
得票数 1
2
回答
是否有用于Ubuntu桌面的语音识别软件(带有GUI)?
、
、
Ubuntu有什么语音识别软件吗?我在找有GUI的东西。
浏览 0
提问于2014-01-02
得票数 8
1
回答
Regex FindAll未打印结果Kotlin
、
我有一个程序,是使用ML使用文本识别在一个文件,我采取这些数据,并只打印价格。因此,我将文本识别字符串传递给下面的正则表达式: val reg = Regex("\$([0-9]*.[0-9]{2})") val matches = reg.findAll(rec) val prices = matches.map{it.groupValues[0]}.joinToString() recogResult.text = prices 我在另一个网站上测试了Regex公式,它获取了所有正确的数据。然而,它没有印刷任何东西。当它到达reg.findAll(rec)
浏览 3
提问于2022-04-22
得票数 2
回答已采纳
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
开源OCR文字识别软件Calamari
[windows] Umi-OCR 免费 · 离线 · 文字识别软件 支持PDF识别 开源
谷歌开源Live Transcribe语音识别转文字工具
【场景文字识别】场景文字识别
5 款不错的开源语音识别/语音文字转换系统
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券