Este projeto converte arquivos DOCX para HTML utilizando o LibreOffice em modo de linha de comando. O conteúdo do arquivo é extraído e gerado em formato HTML, com a preservação de formatação básica como tabelas, negritos e outros estilos.
- Python 3.x
- LibreOffice instalado e acessível via linha de comando (soffice)
Coloque o arquivo DOCX (padrão: Enunciado.docx) na pasta do projeto. Execute o script Python para converter o arquivo DOCX em HTML:
python main.py