Pipelines Assurance Qualité

Plus de vingt mécanismes de contrôle qualité (MCQ) intégrés à chaque étape de vos flux de travail.

Cette page détaille les mécanismes de contrôle qualité (MCQ) intégrés à nos pipelines. Pour les bonnes pratiques d'assurance qualité liées à l'utilisation de l'IA dans vos tâches quotidiennes, veuillez consulter notre guide d'Assurance Qualité de l'IA.

Notre bibliothèque de mécanismes de contrôle qualité (MCQ)

Nous disposons de plus de 20 MCQ documentés, répartis en cinq catégories. La combinaison optimale est définie en fonction du pipeline, des enjeux spécifiques et de la tolérance aux coûts.

Validation déterministe

Coût nul

Ces vérifications basées sur des règles s'exécutent en quelques millisecondes, sans aucun appel à l'IA. Elles détectent les défaillances les plus courantes à un coût nul.

  • Validateur de schéma. Vérifie que la sortie respecte les champs, types et la structure attendus.
  • Validateur de format. Assure que la sortie correspond au format, aux sections et à la hiérarchie des titres prévus.
  • Validateur de plage. Vérifie que les champs numériques se situent dans des limites acceptables.
  • Vérification d'unicité. Garantit l'absence d'identifiants en double ou de collisions dans les champs énumérés.
  • Vérificateur de sous-chaîne. Confirme que les citations extraites sont bien présentes dans le matériel source.
  • Scanner d'identifiants. Détecte les informations personnellement identifiables (IPI) avant qu'elles ne quittent l'infrastructure locale.

Jugement sémantique

Coût LLM par appel

Un modèle d'IA indépendant évalue la sortie en la comparant à une grille d'évaluation ou au matériel source.

  • Juge basé sur une grille d'évaluation. L'IA évalue la sortie selon des critères de qualité spécifiques, attribuant un score de 0 à 1.
  • Détection d'hallucinations. Les affirmations contenues dans la sortie sont recoupées avec le matériel source.
  • Vérification des preuves. Vérifie que chaque affirmation citée est étayée par des preuves fondatrices.
  • Détection des lacunes. Identifie le contenu qui devrait être présent mais qui est manquant.
  • Vérification de cohérence. Assure que le même concept ou code est appliqué de manière cohérente à travers tous les éléments.
  • Vérification du ton. Garantit que la sortie respecte l'image de marque et maintient un ton cohérent.

Sélection de variantes

Coût LLM multi-appels

Génère plusieurs options, puis un juge sélectionne la meilleure. Cette approche est justifiée lorsque la qualité des variantes est hétérogène.

  • Tournoi de variantes. Génère 3 à 5 variantes pour une étape donnée ; le juge évalue chacune et la meilleure est retenue.
  • Filtre de consensus. Trois juges indépendants votent ; la majorité détermine la réussite ou l'échec.
  • A/B comparatif. Compare la sortie révisée à l'originale et retient la meilleure version.

Boucles itératives

Tentatives limitées

En cas d'échec d'une porte, une correction automatique est tentée, suivie d'une nouvelle exécution. Le nombre d'itérations est limité (deux ou trois) afin d'éviter des coûts excessifs.

  • Cycle d'auto-réparation. La sortie ayant échoué est automatiquement corrigée en fonction de la porte spécifique défaillante, puis une nouvelle tentative est effectuée.
  • Critique et révision. Une IA formule une critique, puis une seconde IA applique les corrections en utilisant cette critique comme contexte.
  • Boucle qualité. Évaluation et révision itératives jusqu'à l'atteinte du seuil de qualité ou de la limite d'itérations.

Routage sensible au contexte

Varie

Applique le niveau d'assurance qualité (AQ) approprié à chaque type de tâche. Toutes les portes ne nécessitent pas toutes les vérifications.

  • Porte d'échantillonnage. Pour les pipelines fiables et à volume élevé, l'AQ est effectuée sur un échantillon statistique.
  • Seuil adaptatif. Les sorties à enjeux plus élevés requièrent des scores plus élevés pour être validées.
  • Humain dans la boucle. Les scores limites (0,75-0,84) sont acheminés vers une file d'attente de révision humaine ; les scores inférieurs sont automatiquement bloqués.

Exemple de séquence de portes de qualité

Voici une étape d'IA dans un pipeline de codage qualitatif, suivie de ses portes de qualité. La plupart de ces portes sont des vérifications déterministes à coût nul. Seul le juge basé sur une grille d'évaluation implique un appel LLM.

Étape IA : Codage d'un extrait de transcription

~$0.002

AI

Validateur de schéma

$0

$0

Vérification d'énumération du codebook

$0

$0

Vérificateur de sous-chaîne : la citation est-elle présente dans la source ?

$0

$0

Juge de grille d'évaluation : Fidélité thème-codebook

~$0.003

LLM

Seuil de réussite de 0,85 ; sinon, acheminement vers une révision humaine

Gate

Coût total par élément : environ 0,005 $. Cinq des six portes sont déterministes et à coût nul. Le seul juge LLM représente la seule dépense, et il ne s'exécute que si les portes déterministes sont validées.

Gestion des échecs et routage

Lorsqu'une porte de qualité échoue, le processus ne se poursuit pas silencieusement. La sortie défaillante est acheminée vers une révision humaine, accompagnée de trois informations clés : l'action tentée, la porte ayant échoué et la raison de cet échec.

Le routage est effectué par porte et par étape. Si une porte échoue pour l'élément trois, seul cet élément spécifique de l'étape est signalé. Les autres éléments du lot continuent leur traitement.

Discutons de votre projet pilote

Nous définirons des portes de qualité sur mesure, adaptées à vos données et à vos enjeux spécifiques.

Nous Contacter