首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    MinerU、Magic-PDF、Magic-Doc

    关于 MinerU MinerU 是一款一站式、开源、高质量的数据提取工具,主要包含以下功能: Magic-PDF PDF文档提取 Magic-Doc 网页与电子书提取 github: https://...符合人类阅读顺序的排版格式 保留原文档的结构和格式,包括标题、段落、列表等 提取图像和表格并在markdown中展示 将公式转换成latex 乱码PDF自动识别并转换 支持cpu和gpu环境 支持windows/linux...安装magic-pdf conda create -n MinerU python=3.10 conda activate MinerU pip install -U magic-pdf[full] -...拷贝配置文件并进行配置 在仓库根目录可以获得 magic-pdf.template.json 文件 cp magic-pdf.template.json ~/magic-pdf.json 在magic-pdf.json...跨模态精准解析图文、表格、公式信息 电子书文献提取 支持 epub,mobi等多格式文献,文本图片全适配 语言类型鉴定 支持176种语言的准确识别 安装 前置依赖: python3.10 安装依赖 linux

    2.5K10
    领券