Skip to content

Releases: RapidAI/RapidDoc

v0.9.1

12 Apr 17:25

Choose a tag to compare

Release Note

  • 修复resources中onnx模型打包问题
  • app.py中pdf改为批处理

v0.9.0

12 Apr 16:40

Choose a tag to compare

Release Note

  • 支持印章文本检测
  • 文档方向90°、270°矫正(默认关闭),表格方向90°、270°矫正(默认开启)
# 是否启用图片方向矫正,开启后,可以自动识别并矫正 90°、270°的图片
# os.environ['USE_DOC_ORIENTATION_CLASSIFY'] = "true"
  • 批处理pdf,减少大文档内存占用(使用openvino推理会占用较多内存)
# 批处理数量
# os.environ['MINERU_PROCESSING_WINDOW_SIZE'] = "64"
  • docx优化正文内联SDT内容丢失、长下划线未转义、 OLE/VML图片丢失

v0.8.0

29 Mar 11:55

Choose a tag to compare

Release Note

  • 支持docx/doc、pptx/ppt、xlsx/xls的原生解析(不使用模型)
  • 表格中的单词空格优化 #37
  • 提供更友好的 python 代码内转换的方法 #38
import os
from pathlib import Path
from rapid_doc import RapidDoc
__dir__ = Path(__file__).resolve().parent.parent
output_dir = os.path.join(__dir__, "output")

doc_path_list = [
    __dir__ / "demo/pdfs/示例1-论文模板.pdf",
    __dir__ / "demo/docx/test.docx",
]
engine = RapidDoc()
outputs = engine(doc_path_list, output_dir=output_dir)
for output in outputs:
    print(output.markdown)

v0.7.0

08 Feb 16:11

Choose a tag to compare

Release Note

  • 修复 PP-DocLayoutV2 模型批量推理报错 #33
  • 支持 PP-DocLayoutV3 版面识别+阅读顺序+扭曲倾斜异形框
  • layout_config添加layout_shape_mode参数("rect" / "auto")
  • 支持自定义OCR、公式、表格模型,需实现 CustomBaseModel 的 batch_predict 方法
  • 内置 PaddleOCRVL 系列模型的集成 paddleocr_vl.py (ocr、formula、table)

v0.6.1

29 Dec 14:40

Choose a tag to compare

Release Note

  • layout_config添加markdown_ignore_labels参数
  • 优化PP-DocLayoutV2版面阅读顺序集成
  • 更新RapidDoc的OmniDocBench评测(使用PP-DocLayoutV2)

v0.6.0

28 Dec 13:11

Choose a tag to compare

Release Note

  • 修复表格单字坐标的bug #28
  • rapidocr版本支持3.4.3
  • 保存图片jpg改为png
  • layout支持openvino推理(openvino版本大于2025.4.0,PP_DOCLAYOUTV2暂不支持)
  • openvino使用异步推理替代同步,解决openvino在多线程并发下报错
  • 行内公式判断优化 #29
  • markdown转docx(基于pandoc)
  • markdown转html(基于markdown-it-py + mdit-py-plugins + pygments)
  • 如果解析图片文件,版面识别默认使用原图,可用MINERU_LAYOUT_ORIGINAL_IMAGE环境变量进行关闭
  • 支持 PP-DocLayoutV2 版面识别+阅读顺序
  • 添加 OmniDocBench 评测

v0.5.1

02 Dec 18:21

Choose a tag to compare

Release Note

  • 修复rapidocr3.4.2单字坐标调用方法和其他版本传参不一致问题

v0.5.0

02 Dec 18:13

Choose a tag to compare

Release Note

  • MINERU_MODELS_DIR 环境变量修改为 RAPID_MODELS_DIR
  • 添加基于Gradio的在线demo
  • 添加doclayout版面模型
  • table_config添加use_word_box参数,使用单字坐标匹配单元格,修复#10
  • table_config添加use_compare_table参数,启用表格结果比较(同时跑有线/无线并比对),默认关闭
  • 修复开启复选框识别后出错 #17
  • 修复与 celery 同时使用存在问题 #12
  • table_config添加是否识别表格内公式参数table_formula_enable,是否识别表格内图片参数table_image_enable,默认开启
  • 添加q_cls表格分类的onnx模型(默认使用),table_config添加"cls.model_type"参数

v0.4.0

23 Nov 11:45

Choose a tag to compare

Release Note

  • 移除magika
  • table_cls、unet对齐rapid_table推理代码
  • use_det_mode auto旋转文字识别
  • OCR-torch引擎推理速度提升300%
  • 跟进mineru-2.6.4
  • 添加环境变量MINERU_MODELS_DIR(模型文件存储目录)

v0.3.0

08 Nov 14:08

Choose a tag to compare

Release Note

  • 跟进mineru-2.6.3
  • fastapi支持返回zip压缩文件,返回数据结构更新
  • 公式支持torch推理,仅支持PP-FormulaNet_plus-M模型(GPU下使用)
  • 修复文本型pdf嵌入图片型表格识别问题
  • 过滤表格中“点状”小图像干扰
  • 修复部分版面、表格场景识别问题