RAG Pipeline Optimization with GEPA

A research framework for optimizing Retrieval-Augmented Generation (RAG) pipelines using Generative Evolutionary Prompt Adjustment (GEPA).

📝 Abstract

Retrieval-Augmented Generation (RAG) systems rely on complex interactions between multiple components (Query Planner, Retriever, Reranker, Generator). Optimizing these components individually often leads to sub-optimal end-to-end performance. We introduce a Staged Evolutionary Optimization approach that iteratively refines prompts for each module, ensuring downstream components adapt to the improved signal distributions of upstream modules. Our framework provides robust evaluation, statistical significance testing, and reproducibility for high-stakes domains like financial document analysis.

✨ Key Features

Iterative Staged Optimization: Optimizes components in topological order (Query Planner → Reranker → Generator) to maximize holistic performance.
Modular RAG Architecture:
- Query Planner: Decomposes complex queries.
- Reranker: Cross-encoder based filtering and deduplication.
- Generator: Context-aware response generation.
Robust Evaluation Engine:
- Strict Train/Validation/Test splits to prevent data leakage.
- Comprehensive metrics: Precision/Recall, BLEU/ROUGE, and custom RAGAS-based scores.
- Statistical significance testing (Confidence Intervals, p-values).

🚀 Quick Start

Prerequisites

Python 3.9+
OpenAI API Key (for GPT-4/GPT-3.5)

Installation

Install dependencies
```
pip install -r requirements.txt
```
Configure Environment Create a .env file in the root directory:
```
OPENAI_API_KEY=your_sk_...
```

Running Experiments

To reproduce the full research experiment with train/val/test splits and staged optimization:

python run_research_experiment.py \
    --experiment_name "output_001" \
    --n_queries 100 \
    --model "gpt-4-turbo"

To run a standalone optimization pass:

python run_optimization.py \
    --data_path data/train/ \
    --output_dir gepa_runs/

📂 Project Structure

rag-optimization/
├── modules/                 # Core RAG Component Implementations
│   ├── evaluation/          # Metrics and RAGAS integration
│   ├── generator/           # LLM Response Generation
│   ├── query_planner/       # Query decomposition and strategy
│   ├── reranker/            # Context filtering and ranking
│   ├── base.py              # Base abstractions
│   └── pipeline.py          # End-to-end pipeline orchestrator
├── gepa_adapters/           # GEPA Optimization Interfaces
│   ├── generator_adapter.py
│   ├── query_planner_adapter.py
│   └── reranker_adapter.py
├── run_research_experiment.py # Main entry point for research exp
├── run_optimization.py      # Optimization runner
└── requirements.txt         # Dependencies

📊 Methodology

Our approach optimizes the RAG pipeline in three distinct stages:

Query Planner Optimization: Evolves decomposition strategies to maximize retrieval recall.
Reranker Optimization: Tunes filtering logic using the optimized queries from Stage 1, focusing on precision and context window utilization.
Generator Optimization: Refines response synthesis prompts conditioned on the high-quality context from Stage 2.

📄 License

This project is licensed under the MIT License - see the LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
gepa_adapters		gepa_adapters
modules		modules
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
optimize_chunk_size.py		optimize_chunk_size.py
pyproject.toml		pyproject.toml
run_optimization.py		run_optimization.py
run_research_experiment.py		run_research_experiment.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RAG Pipeline Optimization with GEPA

📝 Abstract

✨ Key Features

🚀 Quick Start

Prerequisites

Installation

Running Experiments

📂 Project Structure

📊 Methodology

📄 License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

RAG Pipeline Optimization with GEPA

📝 Abstract

✨ Key Features

🚀 Quick Start

Prerequisites

Installation

Running Experiments

📂 Project Structure

📊 Methodology

📄 License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages