Skip to content

Conversation

@Lorre-Ramon
Copy link
Owner

No description provided.

* 将OpenPDF的过程单独创建为一个类

* 完善上下文管理器的进入退出在图像文件处理方面

* 添加open_PDF的init

* 移动OpenPDF类进入一个新的文件,划分文件内的类作用

* 优化

* 完成图像反色检测类的编写,config defaults to False

* 完善图片反色检测运行逻辑,基本完成图像提取代码

* 添加对手动创建data 和 log文件夹的注释

* 优化图片创建文件夹的逻辑

* 初步构建PDF图像提取在main中的逻辑

* 修改OpenPDF类为dataclass类

* 完成PDF图像提取的测试

* 添加计时装饰器;添加将特殊INFO信息提交至控制台的类,未实现

* 优化日志提示

* 放弃在logger中添加强制在console中输出特定INFO的做法

* 添加等待动画;发现使用守护线程不能在主线程结束之前结束输出

* 完善装饰器

* 完善docstring

* 新建文本提取文件

* 添加文本提取的测试文件

* 明确了.get_text()为一个可用alias

* finish text extract v1, waiting for debugging; Found document closed error

* text_extract_debug1: finish closed Document problem

* text_extract_debug: complete
@Lorre-Ramon Lorre-Ramon merged commit c348464 into dev/reorganize Nov 22, 2024
Lorre-Ramon added a commit that referenced this pull request Jan 10, 2025
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants