Skip to content

pptx의 차트 처리 #87

@kkcdkk

Description

@kkcdkk

프로젝트

No response

대상 페이지

상세 설명

현재 pptx backend에는 차트를 처리하는 부분이 없음. 차트 처리 방식을 아래 두 가지로 생각하고 구현함

1. chart를 table으로 처리(CHART_MODE=serialize)
    1. label은 Picture임 (docling 상에서 차트 라벨은 PictureTabularChartData로 간주하고 Picture안에 속함)
    2. 차트의 값을 가져와 나타내는데 연속적인 값이 그대로 들어와서 table이 길어지고 차트의 정보(카테코리 등)를 다 가져오지 못함 → 추후 개발 필요
2. chart를 이미지로 변환해서 처리(CHART_MODE=image , 디폴트)
    1. pdf변환
    2. 이미지 크롭
    3. Picture item으로 추가

Metadata

Metadata

Assignees

Labels

No labels
No labels
No fields configured for Feature.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions