ClairaClaira Help Desk

Codage objectif

See in English

Utilisez Claira pour extraire et normaliser des métadonnées factuelles sur les documents (dates, titres, auteurs, types de documents) dans Nuix Discover.

Codage objectif

Le codage objectif consiste à ajouter ou corriger des métadonnées factuelles sur les documents — date du document, titre, auteur, type de document, langue, etc. Contrairement au codage juridique (qui suppose des jugements sur la pertinence ou le privilège), le codage objectif porte sur des informations vérifiables que l'on peut lire directement dans le document.

Cela importe parce que les métadonnées pilotent tout ce qui suit : filtres de recherche, tris, chronologies et ensembles de production dépendent de métadonnées exactes et cohérentes. Lorsqu'elles manquent ou sont erronées, la révision en souffre.

Quand utiliser le codage objectif

  • Métadonnées manquantes. Les documents ont été chargés sans champs clés comme la date ou l'auteur.
  • Imports incomplets. L'extraction de métadonnées pendant le traitement a capturé certains champs mais pas d'autres.
  • Grands volumes à normaliser. Des milliers de documents ont des métadonnées dans des formats incohérents.
  • Besoin de chronologies. Vous avez besoin de dates fiables pour une ligne du temps, mais le champ date existant n'est pas fiable.

Différence avec le codage juridique

Codage objectifCodage juridique
Factuel, vérifiableExige un jugement
Date du document, titre, auteur, type, languePertinence, privilège, étiquettes de questions
Peut être automatisé avec une forte confianceExige une révision humaine
Même réponse quel que soit le réviseurPeut varier selon le réviseur

Le flux de travail

Le codage objectif dans Claira suit sept étapes. Chaque étape s'appuie sur la précédente.

Étape 1 : Ouvrir votre espace de travail Claira

Accédez à votre dossier dans Claira et ouvrez l'espace de travail où vous exécuterez l'analyse de codage objectif.

ClairaDossiersVotre dossierEspace de travail

Étape 2 : Confirmer l'extraction de texte

Avant qu'une analyse puisse traiter un document, il lui faut du texte extrait. Vérifiez que vos documents ont été traités et que l'extraction de texte s'est terminée correctement.

Claira analyse uniquement le texte extrait. Si un document n'a pas de texte extrait — par exemple un PDF image sans ROC — Claira ne peut pas le lire et renverra des valeurs de repli. Vérifiez vos journaux de traitement avant d'exécuter une analyse en lot.

Étape 3 : Créer ou connecter les champs de destination

Vous avez besoin de champs dans Nuix Discover pour stocker la sortie de Claira. Nous recommandons de créer des champs IA dédiés plutôt que d'écrire directement dans vos champs de métadonnées principaux. Cela vous laisse le temps de contrôler la qualité avant d'engager les valeurs.

Exemples de champs :

CO DateDateDate du document extraite par l'IA
CO TitreTexteTitre du document extrait par l'IA
CO AuteurTexteNom d'auteur extrait par l'IA
CO Type de docTexteType de document extrait par l'IA
CO LangueTexteLangue détectée par l'IA

Connectez ces champs dans les paramètres de l'espace de travail Claira pour que les résultats d'analyse soient écrits au bon endroit.

Étape 4 : Construire et tester votre prompt sur un seul document

Commencez par un document pour vérifier que votre prompt produit la sortie attendue. Ouvrez un document en revue unique, saisissez votre prompt et vérifiez le résultat.

Prompt de codage objectif — date

Identifiez la date principale du document. S'il y a plusieurs dates, choisissez la plus récente. Répondez UNIQUEMENT au format MM/JJ/AAAA. S'il n'y a pas de date claire, répondez --

Ce prompt est volontairement strict : une seule date dans un format précis, avec une valeur de repli claire (--) lorsqu'aucune date ne peut être déterminée. Cette structure facilite le contrôle qualité et le traitement en aval.

Construisez un prompt par champ. Un seul prompt qui tente d'extraire date, titre, auteur et type à la fois est plus difficile à tester, plus difficile à contrôler et plus susceptible de produire des résultats incohérents.

Étape 5 : Exécuter une analyse en lot

Lorsque vous êtes satisfait du prompt sur des documents individuels, exécutez-le sur l'ensemble complet (ou un sous-ensemble ciblé) avec la fonction d'analyse en lot de Claira.

Espace de travailAnalyse en lotConfigurerExécuter

Surveillez la progression dans l'espace de travail. Les ensembles plus grands prennent plus de temps, mais vous pouvez continuer à travailler pendant l'exécution.

Étape 6 : Contrôle qualité

C'est l'étape la plus importante. Ne la sautez pas.

  • Filtrez les valeurs de repli. Cherchez dans votre champ de destination la valeur de repli (par ex. --) pour trouver les documents où Claira n'a pas pu extraire la métadonnée. Examinez-les manuellement.
  • Vérifiez par échantillon. Ouvrez 20 à 30 documents couvrant différents types et comparez la sortie de Claira au contenu réel du document.
  • Validez les cas limites. Portez une attention particulière aux formats inhabituels, aux dates multiples ou à l'auteur ambigu.
Si plus de 10 à 15 % des documents renvoient la valeur de repli, votre prompt doit peut-être être affiné, ou la qualité du texte extrait pose problème. Enquêtez avant de poursuivre.

Étape 7 : Mettre à jour les champs de métadonnées principaux

Une fois les résultats contrôlés et jugés fiables, copiez les valeurs de vos champs IA (par ex. CO Date) vers vos champs de métadonnées principaux (par ex. date du document). Cela peut se faire avec les outils de mise à jour en lot des champs de Nuix Discover.

Cette étape est volontairement séparée de l'analyse. Écrire directement dans les champs principaux pendant une analyse signifie que toute erreur fait partie de vos données « production » sans retour en arrière facile. Contrôlez toujours d'abord.

Mode Multi-Code (une passe, plusieurs champs)

Utilisez Multi-Code lorsqu'une seule analyse doit remplir plusieurs sorties (par ex. date, titre, auteur et type de document).

  • Configurez jusqu'à 8 champs dans la section Multi-Code dédiée.
  • Cliquez sur Réinitialiser les champs (en haut à droite de la carte Multi-Code) pour effacer l'instruction partagée, les prompts par champ et les sélections de champs de destination, et restaurer 2 lignes vides.
  • Dans le Laboratoire de prompts, lorsque Claira détecte un prompt à plusieurs sorties, cliquez sur Utiliser Multi-Code pour convertir automatiquement :
    • le texte de préambule partagé est déplacé dans l'instruction partagée Multi-Code,
    • chaque demande de sortie détectée est scindée en un prompt de champ séparé (2 à 8 parties),
    • les lignes Multi-Code existantes sont effacées et reconstruites à partir des parties converties.
  • Utilisez le sélecteur Insérer dans comme cible par défaut pour l'instruction partagée ou une ligne de prompt de champ (toutes les lignes sont listées, y compris celles encore en cours de configuration).
  • Ouvrez Voir l'historique ou Démarrage rapide (modèles ou générateur de prompts) : Claira demande placer le contenu — l'instruction partagée, une ligne de champ existante ou Nouveau champ (jusqu'à 8 lignes). Si la destination contient déjà du texte, choisissez ajouter ou remplacer ensuite.
  • Dans les analyses en lot, l'usage des jetons est facturé par document selon les mêmes règles que les autres analyses en lot, avec des coûts Multi-Code selon le menu Analyser comme :
    • Texte + Multi-Code : 1 jeton par champ configuré (actif) (par ex. 3 champs = 3 jetons par document ; 8 champs = 8 jetons par document).
    • Image + Multi-Code : 5 jetons pour le premier champ plus 1 par champ supplémentaire (3 champs = 7 jetons ; 8 champs = 12 jetons par document).
    • Audio + Multi-Code : 10 jetons pour le premier champ plus 1 par champ supplémentaire (3 champs = 12 jetons ; 8 champs = 17 jetons par document).
    • Vidéo + Multi-Code : 20 jetons pour le premier champ plus 1 par champ supplémentaire (3 champs = 22 jetons ; 8 champs = 27 jetons par document).
    • Les modes image, audio et vidéo exigent tous le forfait Pro ou supérieur. Voir Analyses média pour les formats de fichier acceptés par mode.

Bonnes pratiques

  • Soyez précis dans vos prompts. « Quelle est la date ? » est trop vague. « Identifiez la date principale du document. Répondez UNIQUEMENT en MM/JJ/AAAA. » est clair et testable.
  • Regroupez les types de documents similaires. Si votre collecte comprend contrats, courriels et notes, envisagez des prompts distincts par type. Les contrats ont une « date d'effet » tandis que les courriels ont une « date d'envoi » — un seul prompt peut mal gérer les deux.
  • Contrôlez toujours avant d'engager. Les champs IA existent pour vous offrir une marge de sécurité. Utilisez-la.
  • Utilisez des valeurs de repli. Une valeur de repli claire comme -- ou « N/D » vaut mieux qu'un champ vide. Cela indique que Claira a tenté mais n'a pas trouvé de réponse, ce qui diffère du cas où le document n'a pas été traité.

Limites

  • Le mode Texte ne lit que le texte extrait. En mode Texte, Claira ne peut pas lire les images, notes manuscrites, audio, vidéo ou contenu dans des formats non textuels s'ils n'ont pas été soumis à la ROC ou transcrits. Pour ces documents, changez le menu Analyser comme vers Image, Audio ou Vidéo pour envoyer le fichier source directement à un modèle multimodal.
  • La qualité de la ROC compte en mode Texte. Si la ROC est médiocre (texte illisible, caractères manquants), la sortie de Claira le reflétera. Données de mauvaise qualité en entrée, résultats médiocres en sortie — passer en mode Image est souvent la bonne solution.
  • Les documents sont analysés individuellement. Claira ne croise pas les documents entre eux. Si l'auteur n'est nommé que dans un courriel de couverture mais pas dans le rapport joint, le rapport n'héritera pas de cet auteur.
  • Les cas complexes exigent un jugement humain. Un document avec cinq dates plausibles nécessite un réviseur pour décider laquelle est « principale ». Claira suivra les instructions de votre prompt, mais celles-ci peuvent ne pas couvrir tous les cas limites.

Besoin d'aide ? Contactez support@claira.to

Cette page vous a aide?

Besoin d'aide supplémentaire?

Contactez notre équipe de support à support@claira.to — nous sommes là pour vous aider.