Skip to content

nic01asFr/Colaig

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Albert-Tchap

Assistant pour Tchap basé sur Albert et le modèle Llama

Installation

Prérequis

Étapes d'installation

  1. Cloner le dépôt
git clone https://github.com/votre-organisation/albert-tchap.git
cd albert-tchap
  1. Installation des dépendances
poetry install
  1. Installation des navigateurs pour Playwright
poetry run python scripts/install_playwright.py
  1. Configuration Copiez le fichier .env.example vers .env et modifiez les valeurs selon votre environnement
cp .env.example .env

Utilisation

Démarrer l'application

poetry run python -m albert_tchap.main

Commandes disponibles

  • Recherche web: poetry run python -m albert_tchap.commands.web_search
  • Classification de contenu: poetry run python -m albert_tchap.web.classification

🌐 Système de Commandes Web

Albert-Tchap inclut un système avancé de recherche locale avec actualisation automatique des sources :

Commandes Principales

  • !recherche_web [question] - Recherche intelligente dans les sources indexées
  • !ajouter_lien [URL] - Indexe un site web avec extraction et vectorisation complète
  • !explorer_lien [URL] - Analyse temporaire d'une URL
  • !liste_liens [catégorie?] - Gestion des liens par catégorie

Fonctionnalités Clés

  • Recherche orientée "site" (pas par fragments)
  • 🔄 Actualisation automatique des sources obsolètes
  • 🎯 Seuils adaptatifs selon le type de contenu
  • 📊 Indexation intelligente avec résumés et embeddings
  • 🏷️ Organisation par catégories

Démarrage Rapide

# 1. Indexer une source
!ajouter_lien https://beta.gouv.fr/startups/tchap.html

# 2. Effectuer une recherche
!recherche_web Qu'est-ce que Tchap ?

📚 Guide Complet des Commandes Web | Documentation Détaillée

📚 Système de Gestion des Espaces Documentaires

Colaig implémente un système avancé de gestion d'espaces documentaires qui permet d'isoler les contenus et les contextes par salon.

Espaces Documentaires Isolés

Chaque espace documentaire est isolé avec sa propre structure :

Espace/
└── .albert/
    ├── index/       # Index vectoriel
    ├── contexts/    # Contextes de conversation
    └── behavior/    # Comportements personnalisés

Commandes de Gestion des Espaces

  • !space list - Liste tous les espaces documentaires disponibles
  • !space link <ID> - Associe le salon à l'espace spécifié
  • !space unlink - Supprime l'association du salon
  • !space info - Affiche les informations sur l'espace associé
  • !space index [ID] - Force l'indexation d'un espace spécifique

Fonctionnalités Clés

  • 🔒 Isolation stricte des données entre espaces
  • 🔍 Recherche contextuelle limitée à l'espace du salon
  • 👥 Sessions utilisateur séparées par salon
  • 🛠️ Configurations personnalisées par espace

📝 Documentation Complète du Système

🤖 Système de Comportement

Colaig intègre un système de comportement modulaire qui permet de personnaliser les réponses et actions du bot.

Types de Comportements

  1. Actions - Comportements principaux qui peuvent être déclenchés
  2. Tools - Utilitaires réutilisables pour différentes actions
  3. Prompts - Templates de réponse pour différentes situations
  4. Rules - Contraintes et validations pour le système

Personnalisation par Espace

Chaque espace documentaire peut avoir ses propres comportements personnalisés, permettant d'adapter les réponses aux besoins spécifiques.

Exemple de Comportement Personnalisé

{
  "id": "custom_report_generation",
  "type": "action",
  "description": "Génère des rapports personnalisés",
  "priority": 0.7,
  "triggers": ["générer rapport", "créer un rapport"],
  "configuration": {
    "action_type": "report_generation",
    "required_parameters": ["type_rapport", "période"]
  }
}

📚 Documentation Détaillée du Système de Comportement

Résolution des problèmes courants

Conflit de dépendances

Si vous rencontrez des conflits de dépendances lors du build Docker, notamment avec browser-use, vérifiez que vos versions sont compatibles:

# Versions minimales requises pour browser-use 0.1.41
faiss-cpu>=1.10.0
httpx>=0.27.2
langchain-openai>=0.3.11
pydantic>=2.10.4,<2.11.0
openai>=1.68.2,<2.0.0

Pour mettre à jour ces dépendances dans votre environnement:

pip install --upgrade faiss-cpu httpx langchain-openai "pydantic>=2.10.4,<2.11.0" "openai>=1.68.2,<2.0.0"

Dans un environnement Docker, reconstruisez l'image après avoir mis à jour les dépendances dans pyproject.toml.

Problèmes avec Playwright

Si les navigateurs ne s'installent pas correctement:

poetry run playwright install --with-deps chromium

Développement

Pour exécuter les tests:

poetry run pytest

Albert Tchap

English version below

| Albert API sur GitHub | Modèles Albert sur HuggingFace |

Description du projet

Bot pour Tchap, l'application de messagerie de l'administration française. Ce bot utilise Albert, l'agent conversationnel (large language models, LLM) de l'administration française, pour répondre à des questions sur Tchap, l'application de messagerie de l'administration française.

Le projet est un POC (Proof of Concept - preuve de concept) pour montrer comment un bot peut être utilisé pour répondre à des questions sur Tchap en utilisant Albert. Il s'agit d'un travail WIP (Work In Progress - en cours de développement) et n'est pas (encore) destiné à être utilisé en production.

Le projet est un fork de tchap_bot qui est un bot Matrix pour Tchap, conçu par le Pôle d'Expertise de la Régulation Numérique. La partie bibliothèque (matrix_bot) est fortement inspirée de https://github.com/imbev/simplematrixbotlib.

Contient :

  • app/. : la codebase pour le Tchap bot Albert
  • app/matrix_bot : une bibliothèque qui encapsule matrix-nio faire des bots Matrix

Installation locale

Le projet utilise un fichier de dépendances et de config pyproject.toml et non un fichier requirements.txt. Il est donc nécessaire d'utiliser pip en version 19.0 ou supérieure, ou bien avec un package manager comme pdm, pip-tools, uv, rye, hatch etc. (mais pas poetry qui n'utilise pas le standard pyproject.toml).

# Récupération du code avec Git
git clone ${GITHUB_URL}

# Création d'un environnement virtuel Python
python3 -m venv .venv

# Activation de l'environnement virtuel Python
source .venv/bin/activate

# Installation des dépendances
pip install .

Configuration

Créez le fichier d'environnement app/.env avec les informations de connexion (ou fournissez-les en variables d'environnement). Vous pouvez vous inspirer du fichier app/.env.example qui est initialisé avec les valeurs par défaut :

cp app/.env.example app/.env

L'ensemble des variables d'environements disponibles est documenté dans le fichier suivant : app/config.py

Lancer le bot

Pour lancer le bot executez :

python app

NOTE 1

Cette commande stoppera surement si vous ne la lancez pas en mode sudo car elle installe par défault le data/store et le data/session.txt à la racine "/". Vous pouvez lancer l'application pour qu'elle crée ces fichiers dans le dossier du projet directement avec la commande :

About

Bot for Tchap (the messaging app of the French State) using Albert, the French administration Artificial Intelligence agent

Resources

License

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Python 99.9%
  • Dockerfile 0.1%