Releases · RapidAI/RapidDoc

12 Apr 17:25

hzkitty

v0.9.1

4c25801

v0.9.1 Latest

Latest

Release Note

修复resources中onnx模型打包问题
app.py中pdf改为批处理

Assets 2

12 Apr 16:40

hzkitty

v0.9.0

031f2ae

v0.9.0

Release Note

支持印章文本检测
文档方向90°、270°矫正（默认关闭），表格方向90°、270°矫正（默认开启）

# 是否启用图片方向矫正，开启后，可以自动识别并矫正 90°、270°的图片
# os.environ['USE_DOC_ORIENTATION_CLASSIFY'] = "true"

批处理pdf，减少大文档内存占用（使用openvino推理会占用较多内存）

# 批处理数量
# os.environ['MINERU_PROCESSING_WINDOW_SIZE'] = "64"

docx优化正文内联SDT内容丢失、长下划线未转义、 OLE/VML图片丢失

Assets 2

29 Mar 11:55

hzkitty

v0.8.0

c195cdb

v0.8.0

Release Note

支持docx/doc、pptx/ppt、xlsx/xls的原生解析（不使用模型）
表格中的单词空格优化 #37
提供更友好的 python 代码内转换的方法 #38

import os
from pathlib import Path
from rapid_doc import RapidDoc
__dir__ = Path(__file__).resolve().parent.parent
output_dir = os.path.join(__dir__, "output")

doc_path_list = [
    __dir__ / "demo/pdfs/示例1-论文模板.pdf",
    __dir__ / "demo/docx/test.docx",
]
engine = RapidDoc()
outputs = engine(doc_path_list, output_dir=output_dir)
for output in outputs:
    print(output.markdown)

Assets 2

08 Feb 16:11

hzkitty

v0.7.0

8adc9b2

v0.7.0

Release Note

修复 PP-DocLayoutV2 模型批量推理报错 #33
支持 PP-DocLayoutV3 版面识别+阅读顺序+扭曲倾斜异形框
layout_config添加layout_shape_mode参数（"rect" / "auto"）
支持自定义OCR、公式、表格模型，需实现 CustomBaseModel 的 batch_predict 方法
内置 PaddleOCRVL 系列模型的集成 paddleocr_vl.py (ocr、formula、table)

Assets 2

29 Dec 14:40

hzkitty

v0.6.1

af25bc2

v0.6.1

Release Note

layout_config添加markdown_ignore_labels参数
优化PP-DocLayoutV2版面阅读顺序集成
更新RapidDoc的OmniDocBench评测（使用PP-DocLayoutV2）

Assets 2

28 Dec 13:11

hzkitty

v0.6.0

f08b7b9

v0.6.0

Release Note

修复表格单字坐标的bug #28
rapidocr版本支持3.4.3
保存图片jpg改为png
layout支持openvino推理（openvino版本大于2025.4.0，PP_DOCLAYOUTV2暂不支持）
openvino使用异步推理替代同步，解决openvino在多线程并发下报错
行内公式判断优化 #29
markdown转docx(基于pandoc)
markdown转html(基于markdown-it-py + mdit-py-plugins + pygments)
如果解析图片文件，版面识别默认使用原图，可用MINERU_LAYOUT_ORIGINAL_IMAGE环境变量进行关闭
支持 PP-DocLayoutV2 版面识别+阅读顺序
添加 OmniDocBench 评测

Assets 2

02 Dec 18:21

hzkitty

v0.5.1

ba82c35

v0.5.1

Release Note

修复rapidocr3.4.2单字坐标调用方法和其他版本传参不一致问题

Assets 2

02 Dec 18:13

hzkitty

v0.5.0

64e4515

v0.5.0

Release Note

MINERU_MODELS_DIR 环境变量修改为 RAPID_MODELS_DIR
添加基于Gradio的在线demo
添加doclayout版面模型
table_config添加use_word_box参数，使用单字坐标匹配单元格，修复#10
table_config添加use_compare_table参数，启用表格结果比较（同时跑有线/无线并比对），默认关闭
修复开启复选框识别后出错 #17
修复与 celery 同时使用存在问题 #12
table_config添加是否识别表格内公式参数table_formula_enable，是否识别表格内图片参数table_image_enable，默认开启
添加q_cls表格分类的onnx模型（默认使用），table_config添加"cls.model_type"参数

Assets 2

23 Nov 11:45

hzkitty

v0.4.0

a4df079

v0.4.0

Release Note

移除magika
table_cls、unet对齐rapid_table推理代码
use_det_mode auto旋转文字识别
OCR-torch引擎推理速度提升300%
跟进mineru-2.6.4
添加环境变量MINERU_MODELS_DIR（模型文件存储目录）

Assets 2

08 Nov 14:08

hzkitty

v0.3.0

217b21c

v0.3.0

Release Note

跟进mineru-2.6.3
fastapi支持返回zip压缩文件，返回数据结构更新
公式支持torch推理，仅支持PP-FormulaNet_plus-M模型（GPU下使用）
修复文本型pdf嵌入图片型表格识别问题
过滤表格中“点状”小图像干扰
修复部分版面、表格场景识别问题

Assets 2

Releases: RapidAI/RapidDoc

v0.9.1

Uh oh!

v0.9.0

Uh oh!

v0.8.0

Uh oh!

v0.7.0

Uh oh!

v0.6.1

Uh oh!

v0.6.0

Uh oh!

v0.5.1

Uh oh!

v0.5.0

Uh oh!

v0.4.0

Uh oh!

v0.3.0

Uh oh!