首页
学习
活动
专区
圈层
工具
发布

#ocr

FireRed-OCR开源:2B模型拿下文档解析第一

代码简单说

在做知识库构建和 RAG 项目时,我踩过最多的坑,不是向量检索,而是文档结构还原。

4310

智谱GLM视觉模型家族横向评测:从轻量OCR到多模态Agent,一文搞清怎么选

代码简单说

通过 API 统一接入 zai-sdk,可轻松搭建高可用、低延迟的视觉智能工作流。

9210

[开源]一个 Rust 库搞定 macOS/Windows/Linux 三端 OCR:uniOCR 的 6 个使用要点

DevLlama

uniOCR 就是为了这件事而生的——一个 Rust crate,把上面这些底层差异全部封进同一个 OcrEngine 接口。你写一次代码,三端跑通,云端切换只...

8010

解析银行OCR技术全方案:从核心场景到技术难点

楚识科技OCR

银行业正在经历从“柜面纸质化”到“全流程数字化”的深刻变革。在这个过程中,OCR(光学字符识别)技术承担着将非结构化图像数据转化为结构化业务信息的核心任务。一份...

8500

离线、轻量、免费的OCR信创桌面工具

DeskUI

OCR这项技术历来是大企业的专属,而且由于实现起来非常复杂,造成类库依赖非常严重,结果就是特别重,动辄需要几个G,甚至上百G空间,往往还需要连接互联网。这种限制...

10410

ASR + OCR + LLM 三重校对:如何做到 95%+ 中英字幕准确率

gavin1024

摘要 单一ASR在中文综艺、专业术语、混合口音场景常超10%字错率。本文拆解ASR+OCR+LLM三路并行校对的工业方案,从特征级融合到置信度仲裁,结合腾讯云媒...

19510

8.2K Star!在 GitHub 上发现一款新开源的 OCR 神器,可本地快速解析文档!

开源星探

处理 PDF 文档解析,用一些在线工具不仅解析速度慢,还容易丢失排版信息,想在本地快速提取带位置信息的文本,选择真的不多。

55120
领券