Skip to content

filipwierzejewski/violations_parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📊 Violations Parser – automatyczne generowanie raportów PDF z chaotycznych Exceli

Projekt w Pythonie do wyciągania, czyszczenia i przetwarzania danych z rozmaitych raportów Excel, które mają:

  • scalone komórki
  • pominięte wiersze
  • nieuporządkowane kolumny
  • ogólny bałagan w strukturze danych

Program automatyzuje:

📌 wczytywanie trudnych plików Excel
📌 czyszczenie i normalizację danych
📌 generowanie estetycznych raportów PDF


🧠 Problem, który rozwiązuje

Wiele narzędzi generuje dobre raporty wizualne w Excelu, ale są one trudne do analizy programowej, np.:

  • nagłówki w losowych miejscach
  • scalone/połączone komórki
  • brak logicznej struktury tabelarycznej

Ten skrypt to naprawia i produkuje gotowe raporty PDF, bez ręcznego czyszczenia.


🧰 Technologie

  • Python 3.12
  • pandas — manipulacja danymi
  • reportlab — generowanie PDF
  • openpyxl — obsługa .xlsx
  • xlrd — obsługa starych Exceli .xls

## 📁 Struktura projektu

violations_parser/
├── raport_pdf.py
├── skrypt.py
├── requirements.txt
├── README.md
├── .gitignore
└── images/
    └── example_report.png


🖼️ Przykładowy wygenerowany raport

Przykładowy raport

About

PDF Report Generator from Unstructured Excel Files

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages