ClairaClaira Help Desk

Identification des renseignements personnels

See in English

Utilisez Claira pour repérer et extraire des renseignements personnels identifiables à partir de documents dans Nuix Discover.

Identification des renseignements personnels

Notifications de violation, conformité et évaluations de respect de la vie privée exigent toutes de savoir quels renseignements personnels figurent dans vos documents. Parcourir manuellement des milliers de fichiers à la recherche de noms, d’adresses courriel, de numéros d’assurance sociale et d’adresses est lent et sujet aux erreurs.

Claira parcourt le texte extrait et repère les renseignements personnels identifiables (RPI), ce qui fait gagner du temps à votre équipe et réduit le risque d’en oublier.

En quoi Claira aide

  • Reconnaît plusieurs types de RPI. Noms, adresses courriel, numéros de téléphone, adresses, numéros d’assurance sociale, numéros de comptes financiers, et plus encore.
  • S’adapte aux exigences de conformité. Violations de données, demandes d’accès, audits réglementaires : Claira aide à cibler ce qui mérite l’attention.
  • Fonctionne à grande échelle. Exécutez l’identification des RPI sur l’ensemble des documents en une seule analyse en lot.

Quand utiliser ce cas d’usage

  • Réponse à une violation de données
  • Analyses d’impact sur la vie privée
  • Préparation de documents en vue de listes de masquage ou de caviardage
  • Demandes d’accès (RGPD, Loi 25, CCPA, etc.)

Exemples de requêtes

Vous pouvez adapter l’invite selon que vous ayez besoin d’une extraction ciblée ou d’un inventaire détaillé des formes écrites.

La requête complète « formes d'apparition » ci-dessous est aussi disponible dans l'application sous Enquêtes > RPI — formes d'apparition uniques dans le sélecteur de modèles, avec l'article d'aide ici.

Extraction complète (formes d’apparition uniques)

Utilisez ce modèle quand il vous faut chaque forme rédigée distincte de RPI, sans normalisation, sur une seule ligne de valeurs entre guillemets. Cette forme de sortie constitue une bonne entrée pour les Search Term Families (familles de termes de recherche) de Nuix Discover : chaque valeur (ou chaque regroupement que vous définissez) peut alimenter une famille de recherche ou de contrôle qualité sur l’ensemble de la collection, sans retaper toutes les variantes détectées.

Requête d’extraction de RPI (formes d’apparition uniques)

Extrayez chaque instance unique de renseignements personnels identifiables (RPI) de ce document. Les RPI comprennent, sans s’y limiter : noms complets, noms partiels, initiales, surnoms, titres associés à un nom (p. ex. M. Dupont, Dr Smith), adresses courriel, numéros de téléphone, adresses postales, dates de naissance, identifiants émis par l’État (NAS, NIR, numéros de passeport, de permis de conduire), numéros de comptes financiers, numéros de dossier médical, adresses IP et noms d’utilisateur. N’incluez pas les dates ni les URL qui ne font pas partie d’une adresse courriel. Respectez exactement les règles suivantes :

  • Énumérez chaque forme d’apparition unique de chaque RPI, exactement telle qu’elle apparaît dans le document. Si la même personne, la même adresse ou toute autre entité est écrite sous plusieurs formes, incluez chaque forme distincte comme une entrée séparée (p. ex. "Jean Dupont", "J. Dupont", "M. Dupont", "Dupont, Jean").
  • N’incluez pas de doublon de la même chaîne de caractères. Chaque entrée de la sortie doit être unique caractère par caractère.
  • Ne normalisez, ne corrigez, ne reformatez, n’abrégez ni n’élargissez aucune valeur. Conservez la casse, la ponctuation, les espaces et l’orthographe d’origine, y compris en cas d’erreurs apparentes.
  • Pour les adresses, incluez chaque forme rédigée distincte séparément (p. ex. "123, rue Principale", "123, rue Principale, Montréal, QC").
  • Pour les numéros de téléphone, incluez chaque forme rédigée distincte séparément (p. ex. "514-555-1234", "(514) 555-1234", "+1 514 555 1234").
  • Entourez chaque valeur de guillemets droits doubles. Séparez les entrées par une virgule. N’utilisez pas de sauts de ligne, de puces, de numérotation, d’accolades, de crochets ni aucun autre enveloppe ou délimiteur.
  • N’incluez aucun texte d’introduction, d’explication, d’en-tête, d’étiquette, de catégorie, de compte, de commentaire final ni de clôture. La réponse doit commencer par le premier guillemet et se finir par le dernier. Si aucun RPI n’est trouvé, produisez exactement : "NO PII DETECTED"

Exemple de sortie correctement formatée : "Jean Dupont","J. Dupont","M. Dupont","jean@dupont.co","514-555-1234","123, rue Principale"

La mention d’absence de RPI (NO PII DETECTED) est volontairement identique à la version anglaise pour faciliter les exports et l’automatisation.

Extraction ciblée

Utilisez ce modèle quand vous savez quels types de RPI chercher et que vous voulez une simple liste de paires plutôt qu’un relevé de toutes les formes d’apparition.

Requête ciblée (noms et courriels)

Identifiez tous les noms et toutes les adresses courriel. Regroupez au format : [Nom] <[courriel]> // [Nom] <[courriel]>

Conseils pour de meilleurs résultats

Commencez par la requête complète sur un petit échantillon pour voir quels RPI apparaissent. Passez à une requête ciblée en analyse en lot si vous n’avez besoin que de certains types.
  • Search Term Families. Le résultat de la requête complète sert très bien d’amorce pour les Search Term Families de Nuix Discover : chaque chaîne (ou l’ensemble que vous regroupez) peut fonder une famille de recherche ou de contrôle qualité. Ajustez la composition avant d’étendre au dossier entier.
  • Précisez le format attendu en aval. S’il vous faut un autre type de sortie (p. ex. un journal de caviardage narratif), dites-le dans l’invite, ou employez l’exemple ciblé quand des champs jumelés suffisent.
  • RPI bruts et champs de révision. La sortie complète reprend les valeurs telles qu’elles apparaissent. Limitez la visibilité du champ cible et respectez les règles de votre organisme.
  • Compléter par une relecture humaine. L’identification de RPI est à enjeu élevé. Considérez la sortie de Claira comme un point de départ, avec validation par une personne avant toute action.
Claira analyse uniquement le texte extrait. Si des RPI figurent sur des images, des notes manuscrites ou un texte issu d’une OCR de mauvaise qualité, ils peuvent ne pas être détectés. Vérifiez d’abord la qualité de l’OCR avant de vous reposer sur une extraction de RPI par l’IA.

Besoin d’aide? Contactez support@claira.to

Cette page vous a aide?

Continue reading