book2md é uma ferramenta para transformar livros digitais em artefatos Markdown organizados por capítulo.
O objetivo da aplicação, como um todo, é converter arquivos .epub e .pdf textuais em uma saída local simples, legível e reutilizável para estudo, revisão, arquivamento, busca e processamento posterior. Em vez de entregar um bloco único de texto, o projeto prioriza uma estrutura prática de trabalho: capítulos em .md, metadados normalizados e, quando solicitado, assets associados como imagens.
book2md é útil para quem quer:
- estudar livros em Markdown, capítulo por capítulo
- versionar ou anotar conteúdo exportado em filesystem local
- alimentar pipelines locais de indexação, busca ou processamento textual
- inspecionar a estrutura lógica de um livro com TOC e metadata preservados
Uma exportação bem-sucedida pode gerar:
- um arquivo Markdown por capítulo, com nomes ordenáveis
metadata.jsoncom informações estruturadas do livro, TOC e origem da segmentação- diretório
images/com assets exportados quando--include-imagesé usado - preview local para inspeção rápida dos artefatos gerados
pip install -e .book2md export-epub livro.epub --output ./saida
book2md export-epub livro.epub --output ./saida --include-images
book2md preview ./saida- exporte o livro para um diretório de saída
- revise os capítulos Markdown gerados
- consulte
metadata.jsonpara TOC, origem da segmentação e dados do livro - use
previewpara uma inspeção local rápida, quando necessário
O contrato de saída está documentado em docs/architecture/METADATA_JSON.md.
Na prática, a exportação produz:
- arquivos
.mdpor capítulo metadata.jsoncom contrato documentado emdocs/architecture/METADATA_JSON.md- opcionalmente
images/quando--include-imagesé usado
kb é a implementação principal (source of truth) para a lógica de importação/exportação de livros.
Dentro dessa arquitetura, o repositório book2md existe para:
- oferecer uma experiência CLI focada no caso de uso de exportação
- validar o contrato dos artefatos exportados
- manter testes espelho e fixtures menores
- reduzir divergência entre laboratório e implementação principal
Em outras palavras: a lógica central mora em kb, enquanto book2md empacota, testa e valida a experiência de uso dessa capacidade.
O comando book2md preview <diretório-exportado> abre um servidor local simples para inspecionar:
- capítulos exportados
metadata.json- origem do TOC e da segmentação
- assets exportados