NOVA Agent - Multimodal AI Assistant

NOVA es un asistente de IA multimodal que combina capacidades de texto, voz y visión en una interfaz cyberpunk elegante. Soporta chat conversacional, análisis de imágenes, Push-to-Talk y modo de escucha activa continua.

✨ Características

🗣️ Voz Interactiva: Push-to-Talk y modo de escucha activa continua
👁️ Análisis de Imágenes: Sube imágenes y obtén análisis detallados con instrucciones personalizadas
💬 Chat Inteligente: Conversaciones fluidas con modelos de lenguaje avanzados
🎨 UI Cyberpunk: Interfaz moderna con tema cyberpunk y animaciones
📊 Dashboard: Métricas en tiempo real y visualizaciones con Chart.js
🔧 API REST: Endpoints completos para integración
🚀 Fácil Despliegue: Comando simple para iniciar/detener

🛠️ Instalación

Prerrequisitos

Python 3.8+
Ollama instalado y corriendo
Modelos requeridos: llava:7b, moondream (fallback), dolphin-mistral:7b, mixtral:8x7b

Instalación Rápida

# Clonar el repositorio
git clone <repository-url>
cd NOVA_Agent

# Instalar dependencias
pip install -r requirements.txt

# Instalar modelos de Ollama (requiere ~10GB de espacio)
ollama pull llava:7b
ollama pull moondream
ollama pull dolphin-mistral:7b
ollama pull mixtral:8x7b

# Iniciar NOVA
python3 nova.py start

🚀 Uso

Interfaz Web

Abre http://localhost:8003 en tu navegador
Chat de Texto: Escribe mensajes y presiona Enter o el botón enviar
Voz Push-to-Talk: Mantén presionado el botón del micrófono para hablar
Modo Voz Activa: Activa el botón verde para escucha continua
Análisis de Imágenes:
- Haz clic en el botón de cámara
- Selecciona una imagen
- Agrega instrucciones personalizadas (opcional)
- Envía para análisis

CLI

# Iniciar servidor
python3 nova.py start

# Detener servidor
python3 nova.py stop

# Ver estado
python3 nova.py status

📡 API Endpoints

Chat

POST /api/chat
Content-Type: application/json

{
  "message": "Hola, ¿cómo estás?",
  "session_id": "usuario_123"
}

Análisis de Imágenes

POST /api/upload
Content-Type: multipart/form-data

file: <imagen>
session_id: usuario_123
message: "Describe esta imagen en detalle"

Métricas

GET /api/metrics/full

Estado del Sistema

GET /api/status

🤖 Modelos Soportados

Visión

Primario: llava:7b - Análisis de imágenes de alta calidad
Fallback: moondream - Modelo ligero alternativo

Texto

Primario: dolphin-mistral:7b - Chat conversacional
Avanzado: mixtral:8x7b - Tareas complejas

🎯 Requisitos del Sistema

RAM: 16GB mínimo, 32GB recomendado
GPU: Recomendado para modelos de visión (4GB+ VRAM)
Almacenamiento: ~10GB para modelos
Navegador: Chrome/Edge/Firefox con soporte Web Speech API

🏗️ Arquitectura

nova/
├── api/routes.py      # Endpoints FastAPI
├── core/launcher.py   # Gestión de procesos
├── webui/            # Interfaz frontend
│   ├── index.html    # UI principal
│   ├── main.js       # Lógica cliente
│   ├── styles.css    # Tema cyberpunk
│   └── charts.js     # Dashboard
└── config/           # Configuraciones

🔧 Configuración

Los modelos y configuraciones se definen en config/model_profiles.json:

{
  "vision": {
    "primary": "llava:7b",
    "fallback": "moondream"
  },
  "text": {
    "primary": "dolphin-mistral:7b",
    "advanced": "mixtral:8x7b"
  }
}

🐛 Solución de Problemas

Problemas Comunes

Modelo no encontrado: Asegúrate de que Ollama esté corriendo y los modelos estén descargados
Puerto ocupado: Verifica que el puerto 8003 esté disponible
Voz no funciona: Verifica permisos de micrófono en el navegador
Imágenes no se procesan: Verifica que el modelo de visión esté disponible

Logs

Los logs se guardan en logs/ con información detallada para debugging.

📈 Desarrollo

Estructura del Proyecto

nova.py: CLI principal
nova/api/routes.py: API backend
nova/webui/: Frontend completo
tests/: Suite de pruebas

Contribuir

Fork el repositorio
Crea una rama para tu feature
Agrega tests para cambios nuevos
Envía un pull request

📄 Licencia

Este proyecto está bajo la Licencia MIT.

NOVA Agent - Tu asistente multimodal cyberpunk 🤖✨

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
.vite/deps		.vite/deps
.vscode		.vscode
__pycache__		__pycache__
config		config
data		data
demo		demo
logs		logs
models		models
nova-webui		nova-webui
nova		nova
tests		tests
utils		utils
.env.example		.env.example
.pre-commit-config.yaml		.pre-commit-config.yaml
README.md		README.md
auto_optimize_scheduler.py		auto_optimize_scheduler.py
demo_auto_optimizer.py		demo_auto_optimizer.py
nova.py		nova.py
nova_dashboard.py		nova_dashboard.py
record_demo.py		record_demo.py
requirements.txt		requirements.txt
test_auto_optimizer.py		test_auto_optimizer.py
test_cache_system.py		test_cache_system.py
test_fixes.html		test_fixes.html
test_manual.py		test_manual.py
test_modal.html		test_modal.html
uvicorn.log		uvicorn.log
voice_test.html		voice_test.html

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NOVA Agent - Multimodal AI Assistant

✨ Características

🛠️ Instalación

Prerrequisitos

Instalación Rápida

🚀 Uso

Interfaz Web

CLI

📡 API Endpoints

Chat

Análisis de Imágenes

Métricas

Estado del Sistema

🤖 Modelos Soportados

Visión

Texto

🎯 Requisitos del Sistema

🏗️ Arquitectura

🔧 Configuración

🐛 Solución de Problemas

Problemas Comunes

Logs

📈 Desarrollo

Estructura del Proyecto

Contribuir

📄 Licencia

About

Uh oh!

Releases 1

Packages

Languages

MerariJafet/NOVA_Agent

Folders and files

Latest commit

History

Repository files navigation

NOVA Agent - Multimodal AI Assistant

✨ Características

🛠️ Instalación

Prerrequisitos

Instalación Rápida

🚀 Uso

Interfaz Web

CLI

📡 API Endpoints

Chat

Análisis de Imágenes

Métricas

Estado del Sistema

🤖 Modelos Soportados

Visión

Texto

🎯 Requisitos del Sistema

🏗️ Arquitectura

🔧 Configuración

🐛 Solución de Problemas

Problemas Comunes

Logs

📈 Desarrollo

Estructura del Proyecto

Contribuir

📄 Licencia

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages