현재 pptx backend에는 차트를 처리하는 부분이 없음. 차트 처리 방식을 아래 두 가지로 생각하고 구현함
1. chart를 table으로 처리(CHART_MODE=serialize)
1. label은 Picture임 (docling 상에서 차트 라벨은 PictureTabularChartData로 간주하고 Picture안에 속함)
2. 차트의 값을 가져와 나타내는데 연속적인 값이 그대로 들어와서 table이 길어지고 차트의 정보(카테코리 등)를 다 가져오지 못함 → 추후 개발 필요
2. chart를 이미지로 변환해서 처리(CHART_MODE=image , 디폴트)
1. pdf변환
2. 이미지 크롭
3. Picture item으로 추가
프로젝트
No response
대상 페이지
상세 설명
현재 pptx backend에는 차트를 처리하는 부분이 없음. 차트 처리 방식을 아래 두 가지로 생각하고 구현함