Paper Getting 工具

一个Python脚本，用于从URL下载电赛题目并把其中的图片垂直拼接成一张组合图片。

功能

pip install requests beautifulsoup4 pillow

source .venv/bin/activate  # Linux/Mac
# 或
.venv\Scripts\activate     # Windows

python paper_getter.py

paper_getter.py: 主脚本，处理较新的页面结构（2022年以后）
- 专为处理当前页面布局而设计
- 查找具有 content-desc 和 content-text 类的元素
paper_getter_old.py: 专为2021年及以前竞赛题目设计的特殊脚本
- 仅能提取2021年的赛题图片
- 不支持2020年及以前的年份的赛题获取
- 处理带有 newsMain-content-title 等类的旧页面结构

处理后的图片保存在 output/ 目录中，文件名基于竞赛标题和时间戳，防止重复。