🤖 Sistema Backend de Procesamiento Documental con Gemini AI (n8n)

Pipeline backend API-First para la ingesta, procesamiento y extracción estructurada de documentos (facturas/recibos) utilizando n8n, Gemini 2.5 Flash, Supabase y Google Sheets.
Incluye detección de duplicados (hashing), confidence scoring, persistencia estructurada y monitoreo en tiempo real.

🎯 Problema

El procesamiento manual de facturas y documentos administrativos presenta limitaciones típicas:

Alto consumo de tiempo operativo
Propensión a errores humanos
Falta de trazabilidad y auditoría
Riesgo de duplicación de documentos
Ausencia de validación automática
Dificultad para escalar el proceso

✅ Solución

Se desarrolló un pipeline backend con n8n que:

Recibe documentos vía Webhook
Normaliza los datos de entrada
Detecta duplicados mediante hashing
Persiste datos y estados en Supabase
Extrae texto (OCR)
Procesa y estructura información con Gemini 2.5 Flash
Calcula un confidence score
Registra resultados en Google Sheets (logging + dashboard)
Genera reportes listos para auditoría / publicación

Todo el proceso ocurre sin intervención humana.

🧩 Arquitectura del Workflow

Workflow completo:

Ejecución exitosa:

⚙️ Funcionalidades Implementadas

✅ API-First document intake (Webhook)
✅ OCR document processing
✅ AI structured extraction (Gemini)
✅ Confidence scoring
✅ Duplicate detection (hashing)
✅ Database persistence (Supabase)
✅ Real-time logging (Google Sheets)
✅ Automated reporting
✅ Fully automated workflow

🛠️ Tech Stack

n8n — Orquestación de workflows / integración
Gemini 2.5 Flash — Extracción y estructuración inteligente
Supabase — Persistencia y trazabilidad (DB)
Google Sheets — Logging + dashboard en tiempo real
JavaScript — Lógica de negocio (normalización, hash, scoring)

🔌 Ingesta vía Webhook (Testing)

El sistema expone un endpoint para recibir documentos desde cualquier sistema externo.

Ejemplo de test en Postman:

Respuesta esperada: Workflow was started
Esto confirma que la ingesta dispara el pipeline.

🗄️ Persistencia en Base de Datos (Supabase)

Cada documento procesado se almacena con:

document_hash (hash único)
file_name
extracted_data (JSON estructurado)
confidence_score
status
created_at

Vista de tabla en Supabase:

Esto permite:

Trazabilidad completa
Auditoría
Evitar duplicados

📊 Logging y Dashboard en Tiempo Real (Google Sheets)

Cada ejecución registra un log estructurado con, por ejemplo:

ocrText
extractedData (JSON)
confidence_score
timestamp / created_at
status

Ejemplo de registros:

🎯 Confidence Scoring Automático

El pipeline calcula un puntaje de confianza considerando:

Completitud de campos esperados
Validación / consistencia del output de IA
Señales de “missing fields” o incertidumbre

Ejemplo (confidence score visible en el dashboard):

Esto permite:

Detectar documentos confiables
Marcar casos que requieren revisión manual (si se desea agregar esa regla)

📣 Generación Automática de Reportes

El sistema genera contenido listo para auditoría o publicación (ej: formato de post):

🧠 Arquitectura Técnica (Resumen)

Pipeline:

Webhook
→ Normalization
→ Hashing
→ Supabase Persistence
→ OCR
→ Gemini AI Processing
→ Confidence Scoring
→ Google Sheets Logging
→ Reporting

📈 Resultados

⚡ Procesamiento automático en segundos
🎯 Extracción estructurada confiable
📊 Monitoreo en tiempo real
🔒 Eliminación de duplicados
🤖 Flujo 100% automatizado

🧑‍💻 Mi Rol

Diseño de arquitectura backend completa
Implementación del workflow en n8n
Integración con Gemini AI
Desarrollo de lógica en JavaScript
Integración con Supabase
Implementación de confidence scoring
Implementación de logging y dashboards
Testing end-to-end
Documentación técnica

💼 Casos de Uso

Este sistema puede aplicarse a:

Procesamiento de facturas
Automatización contable
Document intake empresarial
Automatización administrativa
Integraciones con sistemas ERP
Flujos de RPA y backoffice

Author

Maria Fernanda Moreno
Automation Developer | AI Automation | n8n

Showcase de proyectos: https://showcase-de-automatizaciones-y-webs.vercel.app/

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
assets		assets
.env.example		.env.example
.gitignore		.gitignore
Automatización-Inteligente-de-Procesamiento-de-Documentos.json		Automatización-Inteligente-de-Procesamiento-de-Documentos.json
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🤖 Sistema Backend de Procesamiento Documental con Gemini AI (n8n)

🎯 Problema

✅ Solución

🧩 Arquitectura del Workflow

⚙️ Funcionalidades Implementadas

🛠️ Tech Stack

🔌 Ingesta vía Webhook (Testing)

🗄️ Persistencia en Base de Datos (Supabase)

📊 Logging y Dashboard en Tiempo Real (Google Sheets)

🎯 Confidence Scoring Automático

📣 Generación Automática de Reportes

🧠 Arquitectura Técnica (Resumen)

📈 Resultados

🧑‍💻 Mi Rol

💼 Casos de Uso

Author

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

🤖 Sistema Backend de Procesamiento Documental con Gemini AI (n8n)

🎯 Problema

✅ Solución

🧩 Arquitectura del Workflow

⚙️ Funcionalidades Implementadas

🛠️ Tech Stack

🔌 Ingesta vía Webhook (Testing)

🗄️ Persistencia en Base de Datos (Supabase)

📊 Logging y Dashboard en Tiempo Real (Google Sheets)

🎯 Confidence Scoring Automático

📣 Generación Automática de Reportes

🧠 Arquitectura Técnica (Resumen)

📈 Resultados

🧑‍💻 Mi Rol

💼 Casos de Uso

Author

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages