ASM2-Client 📊

Descripción

ASM2-Client es el sistema cliente desarrollado por In2AI para la gestión documental, monitorización y analítica del sistema RAG (Retrieval-Augmented Generation).

El proyecto se compone ahora de varios módulos integrados:

Backend FastAPI: API principal para chat, conectores, autenticación y métricas.
Dashboard SPA: Frontend React/TanStack Router servido por Caddy y conectado al backend vía /api.
Servicios auxiliares: QuestDB para métricas, Qdrant para vectores y Logto para autenticación.

Este sistema permite:

Extraer y visualizar métricas de uso (modelos, tokens, latencia).
Almacenamiento eficiente de series temporales.
Gestión de usuarios y autenticación segura.
Extracción automática de tópicos de documentos.
Integración con el resto de servicios del nodo central.

Arquitectura

El sistema se despliega mediante contenedores Docker orquestados:

Servicio	Descripción
`backend`	API FastAPI para chat, métricas y conectores
`dashboard`	SPA React servida por Caddy
`qdrant`	Base vectorial para búsqueda híbrida
`questdb`	Base de datos Time-Series para métricas
`questdb-init`	Contenedor efímero para inicialización de esquemas
`logto`	Proveedor de autenticación local opcional

Requisitos

Docker y Docker Compose (Recomendado para despliegue).
Python 3.9+ (Para desarrollo local del cliente).
Node.js 18+ y pnpm (Para desarrollo local del dashboard).

Configuración

Archivo `.env`

El proyecto requiere un archivo .env en la raíz. Copia el archivo de ejemplo y configura según tus necesidades:

cp .env.example .env

Variables de Entorno Principales

Credenciales y API

Variable	Descripción	Ejemplo
`OPENAI_API_KEY`	Clave de API para los modelos de OpenAI	`sk-...`
`TOGETHER_API_KEY`	Clave de API de Together.ai (usada por el LLM evaluador del benchmark)	`tgp_v1_...`
`FOLDER_ID`	ID de carpeta para almacenamiento (Google Drive)	`1ABC...`
`CLIENT_SECRET`	JSON del cliente OAuth de Google (mismo contenido que `secrets/client_secret.json`; una sola línea en `.env`)	`{"web":{...}}` o `{"installed":{...}}`
`GOOGLE_CLIENT_SECRET_FILE`	Ruta opcional al fichero JSON del cliente OAuth cuando se monta en Docker	`/app/secrets/client_secret.json`
`HF_TOKEN`	Token de Hugging Face opcional usado solo en tiempo de build del backend para acelerar la descarga de modelos (evita el rate limit anónimo). No se usa en runtime.	`hf_...`

QuestDB

Variable	Descripción	Default
`QUESTDB_HOST`	Host de QuestDB (`questdb` para Docker, IP para VPS)	`questdb`
`QUESTDB_PORT`	Puerto PostgreSQL wire protocol	`8812`
`QUESTDB_USER`	Usuario de base de datos	`admin`
`QUESTDB_PASSWORD`	Contraseña del acceso PostgreSQL wire protocol usado por backend e init SQL	`change_me_for_local_pgwire`
`QUESTDB_DB`	Nombre de la base de datos	`qdb`
`QUESTDB_HTTP_USER`	Usuario del panel web / API HTTP de QuestDB	`admin`
`QUESTDB_HTTP_PASSWORD`	Contraseña del panel web / API HTTP de QuestDB	`change_me_for_local_http`

Logto (Autenticación Dashboard)

Variable	Descripción
`LOGTO_APP_ID`	ID de la aplicación SPA en Logto
`LOGTO_ENDPOINT`	Endpoint compartido de Logto usado por la SPA y por el backend
`LOGTO_API_RESOURCE`	Audience del API compartido entre la SPA y la validación estricta en FastAPI
`LOGTO_ADMIN_ENDPOINT`	Endpoint del panel de administración de Logto
`LOGTO_POSTGRES_PASSWORD`	Contraseña de PostgreSQL usada por Logto self-hosted
`LOGTO_MANAGEMENT_APP_ID`	Client ID opcional de la app M2M para la Management API
`LOGTO_MANAGEMENT_APP_SECRET`	Client secret opcional de la app M2M para la Management API
`LOGTO_MANAGEMENT_API_RESOURCE`	Resource opcional de la Management API de Logto

Langfuse (Trazabilidad)

Tracing opcional de las llamadas LLM y del grafo de LangGraph. Si las tres variables están vacías, el backend arranca con el tracing desactivado y no envía datos a Langfuse.

Variable	Descripción	Ejemplo
`LANGFUSE_PUBLIC_KEY`	Clave pública del proyecto (Langfuse UI → Settings → API Keys)	`pk-lf-...`
`LANGFUSE_SECRET_KEY`	Clave secreta del proyecto	`sk-lf-...`
`LANGFUSE_BASE_URL`	Host de Langfuse.

Langfuse (Trazabilidad)

Tracing opcional de las llamadas LLM y del grafo de LangGraph. Si las tres variables están vacías, el backend arranca con el tracing desactivado y no envía datos a Langfuse.

Variable	Descripción	Ejemplo
`LANGFUSE_PUBLIC_KEY`	Clave pública del proyecto (Langfuse UI → Settings → API Keys)	`pk-lf-...`
`LANGFUSE_SECRET_KEY`	Clave secreta del proyecto	`sk-lf-...`
`LANGFUSE_BASE_URL`	Host de Langfuse.

Aplicación

Variable	Descripción	Default
`CORS_ALLOW_ORIGINS`	Orígenes CORS permitidos por el backend FastAPI (lista separada por comas)	`http://localhost:3000,http://localhost:3001,http://localhost:5173`

Extracción de Tópicos

Variable	Descripción	Default
`CALCULATE_TOPICS`	Habilitar extracción de tópicos (`True`/`False`)	`False`
`TOPIC_MIN_SIZE`	Mínimo de chunks para extraer tópicos	`20000`
`TOPIC_RESOLUTION`	Resolución de detección (menor = más grueso)	`0.025`
`TOPIC_MIN_CONTRIB`	Fracción mínima de representación del tópico	`0.3`

Desarrollo Local del Dashboard

Para el desarrollo del frontend fuera de Docker, usa frontend/.env.local con la URL del backend y el endpoint público de Logto.

El frontend acepta VITE_LOGTO_* y también los aliases LOGTO_* durante el build, pero en este repositorio los archivos Docker Compose usan explícitamente VITE_LOGTO_* para el dashboard.

Nota: Para Google Drive, el backend puede leer el JSON del cliente desde la variable de entorno CLIENT_SECRET en .env, o usar el archivo secrets/client_secret.json montado en el contenedor mediante GOOGLE_CLIENT_SECRET_FILE.

Instalación y Uso

Archivos Docker Compose Disponibles

Archivo	Descripción
`docker-compose.yml`	Stack base remoto-friendly (`backend`, `dashboard`, `qdrant`) con `backend` y `qdrant` solo en red interna Docker
`docker-compose.local.yml`	Override para infraestructura local (`questdb`, `questdb-init`, `logto`) con QuestDB web publicado en `localhost:9000`
`docker-compose.gpu.yml`	Override para habilitar soporte GPU en `backend`
`docker-compose.qdrant-nvidia.yml`	Override para Qdrant con GPU NVIDIA
`docker-compose.qdrant-amd.yml`	Override para Qdrant con GPU AMD (ROCm)
`docker-compose.bench.yml`	Stack para benchmark: reemplaza el web server del `backend` por el evaluador (`benchmark.py`)

Opción 1: Stack Local Completo (Recomendada)

Levanta backend, SPA, Qdrant, QuestDB y Logto local con un solo comando:

./run.sh up

Esto iniciará:

Dashboard: http://localhost:3001
Logto: http://localhost:3011

Servicios internos en este modo:

Backend API: solo accesible desde la red Docker a través de dashboard y otros contenedores
Qdrant: solo accesible desde la red Docker
QuestDB: solo accesible desde la red Docker

Opción 2: Servicios Remotos

Si QuestDB y Logto ya están desplegados fuera de Docker, ejecuta solo backend, dashboard y qdrant:

./run.sh up --remote

Requisitos previos:

Actualiza tu archivo .env con las URLs y credenciales remotas de QuestDB y Logto.

 QUESTDB_HOST=tu-ip-o-hostname-vps
 QUESTDB_PORT=8812
 QUESTDB_USER=admin
 QUESTDB_PASSWORD=tu_contraseña
 LOGTO_ENDPOINT=https://tu-logto-remoto
 LOGTO_APP_ID=tu_spa_app_id
 LOGTO_API_RESOURCE=https://tu-api-resource

Esto iniciará:

Dashboard: http://localhost:3001

Servicios internos en este modo:

Backend API: solo accesible desde la red Docker a través de dashboard
Qdrant: solo accesible desde la red Docker

Opción 3: Docker con Soporte GPU (Backend)

El servicio backend puede utilizar GPU para acelerar el procesamiento. Para habilitar GPU:

./run.sh up --gpu

# Con servicios remotos:
./run.sh up --remote --gpu

Requisitos para GPU:

Drivers NVIDIA instalados
nvidia-container-toolkit

Opción 4: Qdrant con Aceleración GPU

Qdrant soporta aceleración GPU para indexación vectorial. Por defecto, se usa la versión CPU. Puedes habilitar GPU utilizando los archivos de override correspondientes:

GPU NVIDIA

./run.sh up --qdrant nvidia

# Combinando con GPU del backend:
./run.sh up --gpu --qdrant nvidia

Requisitos NVIDIA:

Drivers NVIDIA instalados
nvidia-container-toolkit

GPU AMD (ROCm)

./run.sh up --qdrant amd

Requisitos AMD:

Drivers AMD ROCm instalados
Dispositivos /dev/kfd y /dev/dri accesibles
Usuario en los grupos video y render

Opción 5: Desarrollo Local

Backend FastAPI

cd backend

# Crear el entorno del proyecto e instalar dependencias
uv sync

# Ejecutar el backend
uv run uvicorn server:app --host 0.0.0.0 --port 8001

Dashboard (React SPA)

cd frontend

# Instalar dependencias
pnpm install

# Iniciar servidor de desarrollo
pnpm dev

El dashboard estará disponible en http://localhost:3001.

Opción 6: Benchmark

El modo --bench levanta el stack sustituyendo el servidor web del backend por el script de evaluación benchmark.py, que mide la calidad del pipeline RAG con métricas de RAGAS 0.4.3 (context_precision, context_recall, answer_relevancy, faithfulness) además de los tiempos de cada evaluación (consulta RAG + cálculo de métricas) y de cada lote.

Nota: La versión de RAGAS (0.4.3) está fijada en backend/uv.lock (specifier ragas>=0.4.3). El benchmark depende de la API ragas.metrics.collections de esa versión.

./run.sh up --bench

Requisitos previos:

TOGETHER_API_KEY en .env (el LLM evaluador usa el modelo meta-llama/Llama-3.3-70B-Instruct-Turbo de Together.ai).
OPENAI_API_KEY en .env (los embeddings del evaluador usan text-embedding-3-small de OpenAI).
Un dataset de preguntas/respuestas en benchmark_data/ (por defecto dataset_wikipedia_qa_5_docs_200.csv).

Resultados: se escriben en benchmark_data/ (montado como volumen), entre otros:

rag_evaluation_results_attempt_N.csv — resultados de métricas por pregunta.
query_timings_attempt_N.csv — tiempo total por pregunta (consulta + métricas).
batch_timings_attempt_N.csv — tiempo total por lote.
rag_evaluation_summary.csv — resumen de métricas y tiempos por ejecución.

Por defecto realiza 3 ejecuciones de evaluación (NUM_EVALUATIONS).

Estructura del Proyecto

ASM2-client/
├── backend/                # Backend FastAPI y conectores
├── frontend/               # SPA React/TanStack Router
├── src/                    # Código fuente legacy del cliente Python
├── sql/                    # Scripts de inicialización de base de datos
├── secrets/                # Credenciales y ficheros sensibles
├── img/                    # Imágenes y assets
├── qdrant_index/           # Estado auxiliar y manifest del índice vectorial
├── questdb/               # Datos persistentes de QuestDB (generado)
├── benchmark_data/         # Datasets QA de entrada y resultados del benchmark de RAG
├── docker-compose.yml     # Stack base backend + SPA + qdrant con solo dashboard publicado en localhost
├── docker-compose.local.yml    # Infraestructura local (QuestDB + Logto) con Logto publicado en localhost
├── docker-compose.gpu.yml # Override para soporte GPU (backend)
├── docker-compose.qdrant-nvidia.yml # Override para Qdrant GPU NVIDIA
├── docker-compose.qdrant-amd.yml    # Override para Qdrant GPU AMD
├── docker-compose.bench.yml         # Stack para el benchmark de RAG
├── .env.example           # Plantilla de variables de entorno
└── run.sh                 # Wrapper de modos de ejecución Docker

Logos de financiación IGAPE, Xunta de Galicia y NextGenerationEU

Este proyecto ha sido financiado por el Instituto Galego de Promoción Económica (IGAPE) y la Xunta de Galicia en el marco del Plan de Recuperación, Transformación y Resiliencia, financiado por la Unión Europea – NextGenerationEU, dentro del procedimiento IG408M (“Ayudas para el desarrollo tecnológico y la innovación mediante el uso de la Inteligencia Artificial – IA360”).

Name		Name	Last commit message	Last commit date
Latest commit History 570 Commits
.vscode		.vscode
backend		backend
benchmark_data		benchmark_data
frontend		frontend
img		img
sql		sql
.env.example		.env.example
.gitattributes		.gitattributes
.gitignore		.gitignore
DOKPLOY_HOME_SERVER.md		DOKPLOY_HOME_SERVER.md
GOOGLE_DRIVE_MIGRATION_STATUS.md		GOOGLE_DRIVE_MIGRATION_STATUS.md
LOGTO_SETUP.md		LOGTO_SETUP.md
README.md		README.md
docker-compose.bench.yml		docker-compose.bench.yml
docker-compose.dokploy.yml		docker-compose.dokploy.yml
docker-compose.gpu.yml		docker-compose.gpu.yml
docker-compose.local.yml		docker-compose.local.yml
docker-compose.qdrant-amd.yml		docker-compose.qdrant-amd.yml
docker-compose.qdrant-nvidia.yml		docker-compose.qdrant-nvidia.yml
docker-compose.yml		docker-compose.yml
requirements.txt		requirements.txt
run.sh		run.sh
skills-lock.json		skills-lock.json

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

ASM2-Client 📊

Descripción

Arquitectura

Requisitos

Configuración

Archivo .env

Variables de Entorno Principales

Credenciales y API

QuestDB

Logto (Autenticación Dashboard)

Langfuse (Trazabilidad)

Langfuse (Trazabilidad)

Aplicación

Extracción de Tópicos

Desarrollo Local del Dashboard

Instalación y Uso

Archivos Docker Compose Disponibles

Opción 1: Stack Local Completo (Recomendada)

Opción 2: Servicios Remotos

Opción 3: Docker con Soporte GPU (Backend)

Opción 4: Qdrant con Aceleración GPU

GPU NVIDIA

GPU AMD (ROCm)

Opción 5: Desarrollo Local

Backend FastAPI

Dashboard (React SPA)

Opción 6: Benchmark

Estructura del Proyecto

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Archivo `.env`

Packages