💬 RAG Local avec LM Studio

Ce projet met en place un RAG (Retrieval-Augmented Generation) 100% local sous Windows et macOS.

LM Studio → génération de texte (LLM local, API OpenAI-compatible)
ChromaDB → indexation vectorielle
BAAI/bge-m3 → modèle d’embeddings multilingue (FR inclus)
Streamlit → interface web type ChatGPT

👉 Objectif : poser des questions sur vos propres documents (.pdf, .docx, .txt, .xlsx) et obtenir des réponses sourcées.

Exemple d'utilisation :

🤔 Qu’est-ce qu’un RAG ?

Un RAG (Retrieval-Augmented Generation) combine deux étapes :

Retrieval : recherche des passages pertinents dans vos documents, grâce à des embeddings stockés dans une base vectorielle.
Augmented Generation : le LLM génère une réponse en utilisant ces passages comme contexte.

➡️ Résultat : des réponses fiables, contextualisées et locales.

⚙️ Arborescence du projet

rag_lmstudio/
│── docs/ # Vos documents (peut contenir des sous-dossiers)
│── db/ # Base vectorielle locale (Chroma)
│── .env # Variables d'environnement (API LM Studio, modèle)
│── requirements.txt # Dépendances Python
│── utils_loaders.py # Fonctions de lecture des fichiers
│── build_index.py # Script d’indexation incrémentale
│── app.py # Interface web Streamlit (chat)
│── README.md # Documentation du projet

🚀 Installation

1. Pré-requis

Python 3.10+
LM Studio installé
NVIDIA GPU (CUDA) ou Mac (MPS/CPU) ou CPU seul

2. Installer les dépendances

pip install -r requirements.txt

(choisissez dans le fichier la bonne installation de PyTorch selon Windows/macOS)

3. Configurer LM Studio

Ouvrir LM Studio
Aller dans Developer → Local Server et cliquer sur Start
Charger un modèle (ex. llama-3.1-8b-instruct)
Vérifier qu’il apparaît dans la liste des modèles servis
⚠️ Décochez Allow local network access pour rester en localhost.

🔑 Configuration .env

Créez un fichier .env à la racine :

OPENAI_BASE_URL=http://127.0.0.1:1234/v1
OPENAI_API_KEY=lm-studio
LMSTUDIO_MODEL=llama-3.1-8b-instruct   # nom exact du modèle dans LM Studio

📥 Indexation des documents

Déposez vos fichiers dans docs/ (les sous-dossiers sont pris en charge). Lancez ensuite :

python build_index.py

Les documents sont découpés en chunks
Les embeddings sont calculés (GPU si dispo → sinon MPS/CPU)
La base vectorielle est sauvegardée dans db/

💬 Lancer l’interface

streamlit run app.py

Une page web devrait s'ouvrir sinon : http://localhost:8501

Fonctionnalités :

Interface style ChatGPT
Réponses affichées en streaming
Bouton 🔁 Reconstruire l’index
Affichage des sources et passages utilisés

Auteur

Arthur Prigent

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Pictures		Pictures
docs		docs
.DS_Store		.DS_Store
.env		.env
.gitignore		.gitignore
LICENSE		LICENSE
ReadMe.md		ReadMe.md
app.py		app.py
build_index.py		build_index.py
requirements.txt		requirements.txt
utils_loaders.py		utils_loaders.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

💬 RAG Local avec LM Studio

🤔 Qu’est-ce qu’un RAG ?

⚙️ Arborescence du projet

🚀 Installation

1. Pré-requis

2. Installer les dépendances

3. Configurer LM Studio

Auteur

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

💬 RAG Local avec LM Studio

🤔 Qu’est-ce qu’un RAG ?

⚙️ Arborescence du projet

🚀 Installation

1. Pré-requis

2. Installer les dépendances

3. Configurer LM Studio

Auteur

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages