Releases: RapidAI/RapidDoc
Releases · RapidAI/RapidDoc
v0.9.1
v0.9.0
Release Note
- 支持印章文本检测
- 文档方向90°、270°矫正(默认关闭),表格方向90°、270°矫正(默认开启)
# 是否启用图片方向矫正,开启后,可以自动识别并矫正 90°、270°的图片
# os.environ['USE_DOC_ORIENTATION_CLASSIFY'] = "true"
- 批处理pdf,减少大文档内存占用(使用openvino推理会占用较多内存)
# 批处理数量
# os.environ['MINERU_PROCESSING_WINDOW_SIZE'] = "64"
- docx优化正文内联SDT内容丢失、长下划线未转义、 OLE/VML图片丢失
v0.8.0
Release Note
import os
from pathlib import Path
from rapid_doc import RapidDoc
__dir__ = Path(__file__).resolve().parent.parent
output_dir = os.path.join(__dir__, "output")
doc_path_list = [
__dir__ / "demo/pdfs/示例1-论文模板.pdf",
__dir__ / "demo/docx/test.docx",
]
engine = RapidDoc()
outputs = engine(doc_path_list, output_dir=output_dir)
for output in outputs:
print(output.markdown)v0.7.0
Release Note
- 修复 PP-DocLayoutV2 模型批量推理报错 #33
- 支持 PP-DocLayoutV3 版面识别+阅读顺序+扭曲倾斜异形框
- layout_config添加layout_shape_mode参数("rect" / "auto")
- 支持自定义OCR、公式、表格模型,需实现 CustomBaseModel 的 batch_predict 方法
- 内置 PaddleOCRVL 系列模型的集成 paddleocr_vl.py (ocr、formula、table)
v0.6.1
v0.6.0
Release Note
- 修复表格单字坐标的bug #28
- rapidocr版本支持3.4.3
- 保存图片jpg改为png
- layout支持openvino推理(openvino版本大于2025.4.0,PP_DOCLAYOUTV2暂不支持)
- openvino使用异步推理替代同步,解决openvino在多线程并发下报错
- 行内公式判断优化 #29
- markdown转docx(基于pandoc)
- markdown转html(基于markdown-it-py + mdit-py-plugins + pygments)
- 如果解析图片文件,版面识别默认使用原图,可用MINERU_LAYOUT_ORIGINAL_IMAGE环境变量进行关闭
- 支持 PP-DocLayoutV2 版面识别+阅读顺序
- 添加 OmniDocBench 评测
v0.5.1
v0.5.0
Release Note
- MINERU_MODELS_DIR 环境变量修改为 RAPID_MODELS_DIR
- 添加基于Gradio的在线demo
- 添加doclayout版面模型
- table_config添加use_word_box参数,使用单字坐标匹配单元格,修复#10
- table_config添加use_compare_table参数,启用表格结果比较(同时跑有线/无线并比对),默认关闭
- 修复开启复选框识别后出错 #17
- 修复与 celery 同时使用存在问题 #12
- table_config添加是否识别表格内公式参数table_formula_enable,是否识别表格内图片参数table_image_enable,默认开启
- 添加q_cls表格分类的onnx模型(默认使用),table_config添加"cls.model_type"参数