Sélectionner une page

Formation RAG – Niveau 2 : Pipelines, Vectorisation & Évaluation

pictoObjectifs de la formation

  • Concevoir une architecture RAG avancée adaptée aux usages professionnels.
  • Mettre en place des pipelines RAG robustes et maintenables.
  • Comprendre et maîtriser la vectorisation des données (embeddings).
  • Évaluer la qualité, la pertinence et la fiabilité des réponses RAG.
  • Optimiser les performances d’un système RAG en environnement métier.

pictoPublic visé

  • Responsables IT, data ou transformation digitale.
  • Chefs de projet IA ou data.
  • Consultants IA et data.
  • Responsables qualité, conformité, documentation.
  • Toute personne ayant déjà mis en place ou utilisé un RAG simple.

pictoPré-requis

  • Connaissances des principes de l’IA générative.
  • Avoir suivi un module RAG – Initiationou expérience équivalente.
  • Compréhension des documents et bases de connaissances internes.
  • Aucun développement avancé requis (approche fonctionnelle et méthodologique).

pictoContenu de la formation

  1. Rappels et montée en complexité du RAG
  • Limites des systèmes RAG simples.
  • Problématiques de précision et de cohérence.
  • Enjeux de passage à l’échelle.
  • Cas d’usage nécessitant un RAG avancé.
  1. Architecture d’un pipeline RAG avancé
  • Découpage des étapes du pipeline RAG.
  • Chaînage ingestion → indexation → recherche → génération.
  • Rôle des composants dans la fiabilité globale.
  • Organisation modulaire du pipeline.
  1. Vectorisation des données (embeddings)
  • Principe des embeddings sémantiques.
  • Choix des modèles d’embeddings selon les usages.
  • Impact de la vectorisation sur la qualité des réponses.
  • Bonnes pratiques de cohérence et homogénéité.
  1. Préparation avancée des documents
  • Découpage intelligent des contenus (chunking).
  • Granularité optimale des données.
  • Gestion des métadonnées.
  • Versioning des documents sources.
  1. Recherche et récupération avancée
  • Recherche sémantique vs recherche hybride.
  • Filtrage par métadonnées.
  • Pondération et hiérarchisation des résultats.
  • Gestion du bruit informationnel.
  1. Génération augmentée et contrôle des réponses
  • Interaction entre contexte récupéré et génération.
  • Limitation des hallucinations.
  • Gestion des conflits de sources.
  • Structuration des réponses finales.
  1. Évaluation des performances du RAG
  • Indicateurs de qualité des réponses.
  • Pertinence, exactitude et complétude.
  • Méthodes d’évaluation manuelle et semi-automatisée.
  • Analyse des écarts et erreurs.
  1. Amélioration continue et optimisation
  • Boucles d’amélioration des pipelines.
  • Ajustement des paramètres d’indexation.
  • Ré-entraînement ou mise à jour des embeddings.
  • Suivi de la performance dans le temps.
  1. Sécurité, gouvernance et conformité
  • Gestion des accès aux données vectorisées.
  • Protection des informations sensibles.
  • Traçabilité des sources utilisées.
  • Conformité RGPD et gouvernance documentaire.
  1. Cas pratiques professionnels
  • Conception d’un pipeline RAG avancé.
  • Vectorisation d’un corpus documentaire réel.
  • Tests de recherche et génération.
  • Évaluation et optimisation du système mis en place.

pictoMéthodes pédagogiques

  • Apports théoriques structurés.
  • Schémas d’architecture RAG.
  • Études de cas professionnels.
  • Ateliers pratiques guidés.

pictoMoyens pédagogiques

  • Supports pédagogiques dédiés au RAG avancé.
  • Corpus documentaires anonymisés.
  • Exemples de pipelines et architectures.
  • Fiches méthodologiques d’évaluation.

pictoModalités d’évaluation

  • Évaluation des connaissances par questionnaire.
  • Analyse d’un pipeline RAG conçu par le stagiaire.
  • Validation de la capacité à évaluer et améliorer un RAG.
  • Attestation de fin de formation remise au stagiaire.
Aller au contenu principal