Skip to content

qnbs/AI-Research-Orchestrator

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

52 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AI Research Orchestration Author

Ask DeepWiki

Status Version Tech License Privacy

A sophisticated, agentic expert system for high-dimensional literature synthesis, automated knowledge discovery, and scientometric analysis.

🚀 Live Demo | Get Gemini API Key


🇬🇧 English Documentation

🌌 Executive Overview

The AI Research Orchestration Author represents a paradigm shift in scientific inquiry tools. It is a state-of-the-art frontend application designed to autonomously conduct rigorous literature reviews by coupling the vast biomedical corpus of PubMed with the advanced cognitive reasoning capabilities of Google's Gemini 2.5 Flash and Gemini 3 Pro models.

Unlike conventional summarization tools, this system employs a multi-agent orchestration pattern. It decomposes complex research questions into constituent logic streams, autonomously formulates Boolean search strategies, executes live API retrieval, ranks findings using semantic understanding, and synthesizes narrative reports with academic precision.

Core Philosophy:

  • Local-First Sovereignty: A zero-knowledge architecture where all data resides within the user's browser (IndexedDB).
  • Agentic Reasoning: Autonomous query formulation, decision-making, and relevance scoring.
  • Traceability & Grounding: Every AI assertion is inextricably linked to a verified PubMed ID (PMID).

🚀 Advanced Capabilities

1. 🧠 The Orchestrator (Agentic Pipeline)

The application's core is a multi-stage generative pipeline that mimics the workflow of a human researcher:

  • Query Formulation Agent: Analyzes natural language intent to construct high-precision Boolean search strings tailored to PubMed's MeSH taxonomy.
  • Live Retrieval Engine: Interfaces directly with the NCBI E-utilities API to fetch metadata for hundreds of candidate articles in real-time.
  • Semantic Ranking Agent: Reads titles and abstracts to score relevance (0-100) against specific research contexts, utilizing a dedicated "Thinking Budget" for complex nuance detection.
  • Synthesis Agent: Streams a comprehensive, cited executive summary, highlighting consensus, contradictions, and critical gaps in the literature.

2. 📚 Intelligent Knowledge Base

A persistent, self-organizing library for long-term research management.

  • Deduplication Engine: Automatically merges duplicate entries while preserving the highest-fidelity metadata.
  • Semantic Filtering: Advanced faceting allows filtering by AI-generated tags, article types, authors, and publication venues.
  • Data Visualization: Integrated analytics visualize publication trends over time, journal impact distributions, and keyword frequency.

3. 🔬 Rapid Research Assistant

A lightweight, high-speed tool for ad-hoc inquiry and validation.

  • Abstract Analysis: Paste complex text to generate "TL;DR" summaries and extract key findings instantly.
  • Latent Similarity Search: Uses semantic understanding to discover related papers based on conceptual overlap rather than just keyword matching.
  • Cross-Modal Grounding: Cross-references scientific findings with live web search data to provide broader societal or clinical context.

4. 👤 Scientometric Hubs (Authors & Journals)

  • Author Disambiguation: Leverages AI to cluster publications and distinguish between researchers with identical names based on co-authorship networks and affiliation patterns.
  • Impact Metrics: Estimates H-Index, citation flows, and identifies core research concepts over a career.
  • Journal Profiling: AI-generated profiles of publication venues, analyzing scope, Open Access policies, and thematic focus areas.

🛠️ Technical Architecture

This application is a Progressive Web App (PWA) built on a modern, performance-oriented stack designed for the edge.

Technology Stack

  • Framework: React 19 (leveraging Suspense, Concurrent Mode, and refined Hooks).
  • Language: TypeScript ensuring strict type safety and architectural robustness.
  • AI Integration: @google/genai SDK connecting to Gemini 2.5 Flash (for speed) and Gemini 3 Pro (for reasoning).
  • State/Storage: Dexie.js (IndexedDB wrapper) for high-performance, offline-capable structured local storage.
  • Styling: Tailwind CSS with a custom "Cybernetic" design system featuring glassmorphism and ambient animations.
  • Visualization: Chart.js for reactive data analytics.
  • Export: jsPDF for client-side PDF report compilation.

Design Patterns

  • Streaming Responses: Utilizes Gemini's streaming API to provide immediate feedback during long-running synthesis tasks.
  • Resilient Networking: Implements exponential backoff strategies for robust interaction with public APIs.
  • Component Architecture: Modular, lazy-loaded components ensure fast initial load times and efficient code splitting.
  • Accessibility: Fully ARIA-compliant UI with keyboard navigation support (Command Palette ⌘+K).

⚡ Getting Started

Quick Start (Live App)

  1. Visit https://qnbs.github.io/AI-Research-Orchestrator/
  2. Click Settings (gear icon) → API Key
  3. Enter your Gemini API Key (stored encrypted locally, never sent to any server)
  4. Start researching!

Local Development

# Clone repository
git clone https://github.com/qnbs/AI-Research-Orchestrator.git
cd AI-Research-Orchestrator

# Install dependencies
npm install

# Start development server
npm run dev

# Build for production
npm run build

Tests & CI

npm run typecheck    # TypeScript (strict, no emit)
npm run lint         # ESLint (warning budget in package.json)
npm run test:coverage # Vitest + coverage thresholds (logic layers — vitest.config.ts)
npm run test:e2e     # Playwright E2E (one-time: npx playwright install chromium)
npm run build        # Production bundle

On every push to main and on pull requests targeting main, GitHub Actions runs install, typecheck, lint, tests with coverage, and production build (see .github/workflows/deploy.yml). Upload and deployment to GitHub Pages run only when the ref is refs/heads/main and the event is not a pull request.

Cursor / IDE setup

For AI-assisted work in Cursor, see AGENTS.md, .cursor/rules/, and CONTRIBUTING.md.

Prerequisites

  • Node.js 18+ and npm
  • A modern browser (Chrome, Edge, Safari, Firefox)
  • A Google Gemini API KeyGet one here

How to Set Your API Key

The app stores your API key securely encrypted in your browser's IndexedDB using AES-GCM encryption:

  1. Open the app
  2. Navigate to SettingsAPI Key
  3. Enter your Gemini API Key
  4. Click Save Key

⚠️ Security Note: Your API key is encrypted with Web Crypto API and stored locally. It never leaves your browser or gets sent to any external server (except Google's Gemini API for inference).


⚙️ Configuration & Customization

The application features a granular settings engine allowing precise tuning of the AI's cognitive profile.

  • AI Persona: Switch between "Neutral Scientist", "Creative Synthesizer", or "Critical Reviewer" to adjust the rhetorical tone.
  • Temperature: Fine-tune creativity (0.0 for deterministic facts, 0.8 for hypothesis generation).
  • Thinking Budget: Allocate specific token counts for the model's internal reasoning process before output generation (enabled for Gemini 2.5/3.0 models).
  • Language: Force output in specific languages (English, German, French, Spanish) regardless of input source language.

🛡️ Privacy & Security

Zero-Knowledge Architecture:

  • Local Storage: All user data (reports, history, settings) resides exclusively in your browser's IndexedDB.
  • Direct-to-API: The app communicates directly with Google's Gemini API and NCBI's PubMed API. No intermediate backend server collects, stores, or analyzes your data.
  • Data Portability: You own your data. Export complete datasets to JSON, CSV, RIS, BibTeX, or PDF at any time.

📄 License

Distributed under the MIT License. See LICENSE for more information.


🚀 Deployment

This app is configured for GitHub Pages deployment:

  1. Automatic Deployment: Push to main branch triggers GitHub Actions workflow
  2. Manual Deployment: Run npm run build and deploy dist/ folder

GitHub Actions Setup

The repository includes .github/workflows/deploy.yml that:

  • Runs install, TypeScript, ESLint, tests with coverage, and production build on every push to main and on pull requests targeting main
  • Uploads and deploys to GitHub Pages only for pushes (or manual dispatch) on main — not for pull requests
  • Handles SPA routing via 404.html fallback

Self-Hosting

npm run build
# Deploy dist/ folder to any static hosting:
# - Netlify, Vercel, Cloudflare Pages
# - AWS S3 + CloudFront
# - Any web server (nginx, Apache)

🔧 Troubleshooting

Issue Solution
"API Key Required" error Go to Settings → API Key and enter your Gemini API key
PubMed requests failing Check internet connection; NCBI may have rate limits
PWA not installing Ensure HTTPS and valid manifest.json
Blank page after navigation Clear browser cache and reload
CI fails on TypeScript or tests Run npm run typecheck and npm run test:run locally; fix reported errors


🇩🇪 Deutsche Dokumentation

🌌 Überblick

Der AI Research Orchestration Author markiert einen Paradigmenwechsel bei Werkzeugen für wissenschaftliche Recherche. Es handelt sich um eine hochmoderne Frontend-Anwendung, die entwickelt wurde, um rigorose Literaturrecherchen autonom durchzuführen. Hierbei wird der riesige biomedizinische Korpus von PubMed mit den fortschrittlichen kognitiven Fähigkeiten der Modelle Google Gemini 2.5 Flash und Gemini 3 Pro gekoppelt.

Im Gegensatz zu herkömmlichen Zusammenfassungstools verwendet dieses System ein Multi-Agenten-Orchestrierungsmuster. Es zerlegt komplexe Forschungsfragen in logische Teilströme, formuliert autonom boolesche Suchstrategien, führt Live-API-Abrufe durch, bewertet Ergebnisse mittels semantischem Verständnis und synthetisiert narrative Berichte mit akademischer Präzision.

Kernphilosophie:

  • Local-First-Souveränität: Eine Zero-Knowledge-Architektur, bei der alle Daten ausschließlich im Browser des Nutzers (IndexedDB) verbleiben.
  • Agentisches Denken: Autonome Abfrageformulierung, Entscheidungsfindung und Relevanzbewertung.
  • Rückverfolgbarkeit & Grounding: Jede KI-Aussage ist untrennbar mit einer verifizierten PubMed-ID (PMID) verknüpft.

🚀 Erweiterte Funktionen

1. 🧠 Der Orchestrator (Agenten-Pipeline)

Das Herzstück der Anwendung ist eine mehrstufige generative Pipeline, die den Arbeitsablauf eines menschlichen Forschers nachahmt:

  • Abfrageformulierungs-Agent: Analysiert die natürliche Sprachabsicht, um hochpräzise boolesche Suchstrings zu konstruieren, die auf die MeSH-Taxonomie von PubMed zugeschnitten sind.
  • Live-Retrieval-Engine: Interagiert direkt mit der NCBI E-utilities API, um Metadaten für Hunderte von Kandidatenartikeln in Echtzeit abzurufen.
  • Semantischer Ranking-Agent: Liest Titel und Abstracts, um die Relevanz (0-100) für spezifische Forschungskontexte zu bewerten, wobei ein spezielles "Thinking Budget" für die Erkennung komplexer Nuancen genutzt wird.
  • Synthese-Agent: Streamt eine umfassende, zitierte Zusammenfassung für Führungskräfte, die Konsens, Widersprüche und kritische Lücken in der Literatur hervorhebt.

2. 📚 Intelligente Wissensdatenbank

Eine persistente, sich selbst organisierende Bibliothek für langfristiges Forschungsmanagement.

  • Deduplizierungs-Engine: Führt doppelte Einträge automatisch zusammen und bewahrt dabei die hochwertigsten Metadaten.
  • Semantische Filterung: Erlaubt das Filtern nach KI-generierten Tags, Artikeltypen, Autoren und Publikationsorten.
  • Datenvisualisierung: Integrierte Analysen visualisieren Publikationstrends im Zeitverlauf, Impact-Verteilungen von Journalen und Keyword-Häufigkeiten.

3. 🔬 Forschungsassistent (Rapid Research Assistant)

Ein leichtgewichtiges Hochgeschwindigkeitstool für Ad-hoc-Anfragen und Validierung.

  • Abstract-Analyse: Fügen Sie komplexen Text ein, um "TL;DR"-Zusammenfassungen zu generieren und Schlüsselerkenntnisse sofort zu extrahieren.
  • Latente Ähnlichkeitssuche: Nutzt semantisches Verständnis, um verwandte Arbeiten basierend auf konzeptionellen Überschneidungen statt reiner Keyword-Übereinstimmung zu entdecken.
  • Cross-Modal Grounding: Vergleicht wissenschaftliche Erkenntnisse mit Live-Websuchdaten, um breiteren gesellschaftlichen oder klinischen Kontext zu liefern.

4. 👤 Szientometrische Hubs (Autoren & Journale)

  • Autoren-Disambiguierung: Nutzt KI, um Publikationen zu clustern und Forscher mit identischen Namen anhand von Co-Autorschaftsnetzwerken und Affiliationsmustern zu unterscheiden.
  • Impact-Metriken: Schätzt den H-Index, Zitationsflüsse und identifiziert Kernforschungskonzepte über eine gesamte Karriere hinweg.
  • Journal-Profiling: KI-generierte Profile von Publikationsorten, die Umfang, Open-Access-Richtlinien und thematische Schwerpunkte analysieren.

🛠️ Technische Architektur

Diese Anwendung ist eine Progressive Web App (PWA), die auf einem modernen, leistungsorientierten Stack basiert und für Edge-Umgebungen konzipiert ist.

Technologie-Stack

  • Framework: React 19 (nutzt Suspense, Concurrent Mode und verfeinerte Hooks).
  • Sprache: TypeScript für strikte Typsicherheit und architektonische Robustheit.
  • KI-Integration: @google/genai SDK zur Verbindung mit Gemini 2.5 Flash (für Geschwindigkeit) und Gemini 3 Pro (für Reasoning).
  • Status/Speicher: Dexie.js (IndexedDB-Wrapper) für hochperformante, offline-fähige strukturierte lokale Speicherung.
  • Styling: Tailwind CSS mit einem benutzerdefinierten "Cybernetic"-Designsystem mit Glassmorphismus und ambienten Animationen.
  • Visualisierung: Chart.js für reaktive Datenanalysen.
  • Export: jsPDF für clientseitige PDF-Berichterstellung.

⚡ Erste Schritte

Schnellstart (Live App)

  1. Besuchen Sie https://qnbs.github.io/AI-Research-Orchestrator/
  2. Klicken Sie auf Einstellungen (Zahnrad-Icon) → API Key
  3. Geben Sie Ihren Gemini API Key ein (wird verschlüsselt lokal gespeichert)
  4. Starten Sie Ihre Recherche!

Lokale Entwicklung

# Repository klonen
git clone https://github.com/qnbs/AI-Research-Orchestrator.git
cd AI-Research-Orchestrator

# Abhängigkeiten installieren
npm install

# Entwicklungsserver starten
npm run dev

# Für Produktion bauen
npm run build

Tests & CI

npm run typecheck    # TypeScript (strikt, ohne Emit)
npm run lint         # ESLint (Warnbudget in package.json)
npm run test:coverage # Vitest + Coverage-Schwellen (Logiklayer — vitest.config.ts)
npm run test:e2e     # Playwright E2E (einmalig: npx playwright install chromium)
npm run build        # Produktionsbundle

Bei jedem Push auf main und bei Pull Requests gegen main führt GitHub Actions Installation, Typecheck, Lint, Tests mit Coverage und Production-Build aus (.github/workflows/deploy.yml). Upload und Deploy nach GitHub Pages erfolgen nur auf refs/heads/main, nicht bei PRs.

Cursor / IDE

Für KI-gestützte Entwicklung in Cursor: AGENTS.md, .cursor/rules/ und CONTRIBUTING.md.

Voraussetzungen

  • Node.js 18+ und npm
  • Ein moderner Browser (Chrome, Edge, Safari, Firefox)
  • Ein Google Gemini API KeyHier erhalten

API Key einrichten

Die App speichert Ihren API Key sicher verschlüsselt in der IndexedDB Ihres Browsers (AES-GCM Verschlüsselung):

  1. App öffnen
  2. Navigieren Sie zu EinstellungenAPI Key
  3. Geben Sie Ihren Gemini API Key ein
  4. Klicken Sie auf Schlüssel speichern

⚠️ Sicherheitshinweis: Ihr API Key wird mit der Web Crypto API verschlüsselt und lokal gespeichert. Er verlässt niemals Ihren Browser und wird an keinen externen Server gesendet (außer an die Google Gemini API für Inferenz).


⚙️ Konfiguration & Anpassung

Die Anwendung verfügt über eine granulare Einstellungs-Engine, die eine präzise Abstimmung des kognitiven Profils der KI ermöglicht.

  • KI-Persona: Wechseln Sie zwischen "Neutraler Wissenschaftler", "Kreativer Synthetisierer" oder "Kritischer Gutachter", um den rhetorischen Ton anzupassen.
  • Temperatur: Feinabstimmung der Kreativität (0.0 für deterministische Fakten, 0.8 für Hypothesengenerierung).
  • Thinking Budget: Weisen Sie spezifische Token-Anzahlen für den internen Denkprozess des Modells zu, bevor die Ausgabe generiert wird (aktiviert für Gemini 2.5/3.0 Modelle).
  • Sprache: Erzwingen Sie die Ausgabe in bestimmten Sprachen (Englisch, Deutsch, Französisch, Spanisch) unabhängig von der Eingangssprache.

🛡️ Datenschutz & Sicherheit

Zero-Knowledge-Architektur:

  • Lokaler Speicher: Alle Benutzerdaten (Berichte, Verlauf, Einstellungen) befinden sich ausschließlich in der IndexedDB Ihres Browsers.
  • Direkt-zu-API: Die App kommuniziert direkt mit der Google Gemini API und der NCBI PubMed API. Kein zwischengeschalteter Backend-Server sammelt, speichert oder analysiert Ihre Daten.
  • Datenportabilität: Ihre Daten gehören Ihnen. Exportieren Sie vollständige Datensätze jederzeit als JSON, CSV, RIS, BibTeX oder PDF.

📄 Lizenz

Veröffentlicht unter der MIT-Lizenz. Siehe LICENSE für weitere Informationen.


Haftungsausschluss: Dieses Tool nutzt generative KI. Obwohl es Grounding-Techniken (PubMed-Zitate) verwendet, können gelegentlich Ungenauigkeiten auftreten. Überprüfen Sie Ergebnisse immer anhand der in den Berichten verlinkten Originalquelldokumente.

About

An expert system to manage a swarm of specialized agents to conduct comprehensive literature reviews using the PubMed database, collecting, curating, and synthesizing scientific research based on user-defined criteria.

Resources

License

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors