Un client navigue anonymement sur son smartphone, ouvre plus tard un e-mail publicitaire sur son ordinateur de bureau, puis finalise l'achat dans l'application – et dans les systèmes de données, cette seule personne apparaît comme trois individus distincts. C'est précisément ce problème que résout la résolution d'identité : la discipline qui relie des points de données fragmentés à travers les appareils, navigateurs, applications et canaux en un profil client unique et unifié. L'ampleur de l'écart ressort d'une étude Comscore : 54 % des impressions mobiles et 36 % des impressions desktop ne portent aucun identifiant classique.
Cet article explique ce qu'est la résolution d'identité, pourquoi elle est indispensable à un analytics fiable, comment fonctionnent l'appariement déterministe et probabiliste, et quelles étapes transforment des signaux bruts en un profil de confiance. La façon dont le server-side tagging sécurise la collecte de données est traitée dans l'article de fond de ce cluster.
Ce qu'est la résolution d'identité – et pourquoi elle compte
La résolution d'identité est le processus qui examine les interactions issues de nombreuses sources pour déterminer si elles appartiennent à la même personne, et les réunit en une vue client unique. Certains clients sont identifiables via leurs identifiants de connexion, adresses e-mail, numéros de téléphone ou ID de compte ; d'autres restent anonymes pendant leur navigation. Les systèmes modernes évaluent en continu les deux types d'interactions – connues et anonymes – pour reconnaître les relations possibles entre elles.
Sans résolution d'identité, la mesure marketing est fondamentalement faussée : elle attribue les résultats à des points de contact isolés plutôt qu'aux parcours multi-touch qui motivent réellement les décisions d'achat. Seul le profil unifié évite les sollicitations en double, permet une segmentation fiable et rend les analyses, la personnalisation et l'activation dignes de confiance.
Appariement déterministe contre probabiliste
Deux approches fondamentales déterminent la façon dont les enregistrements sont reliés.
Appariement déterministe
L'appariement déterministe relie les données via des identifiants exacts comme l'adresse e-mail ou le numéro de téléphone – le « détective » de la résolution d'identité, qui apparie avec précision quand des indices univoques existent. Si un client se connecte avec la même adresse e-mail que celle utilisée lors de son achat, les deux sessions se relient à la même personne avec une certitude proche de 100 %. L'approche est très précise et facile à auditer, mais dépend de la qualité des données et ne fonctionne que si des identifiants fiables sont disponibles. Bonne pratique : toujours commencer par l'appariement déterministe.
Appariement probabiliste
L'appariement probabiliste introduit des algorithmes statistiques – tel un puzzle aux pièces manquantes. Il évalue plusieurs attributs ensemble (comportement, caractéristiques d'appareil, adresse IP) et attribue un score de confiance ; s'il dépasse un seuil défini, les enregistrements sont reliés. Cela réduit la fragmentation en l'absence de correspondances exactes, mais doit être soigneusement calibré pour éviter de relier à tort des clients sans rapport.
Comment le processus fonctionne étape par étape
Des signaux bruts naît un profil en plusieurs étapes. D'abord, l'activité client est collectée sur tous les points de contact – visites du site, activité applicative, engagement e-mail, interactions CRM, comportement d'achat, réponses aux campagnes, contacts au support. Avant tout appariement, les identifiants doivent être nettoyés : e-mails normalisés, numéros de téléphone standardisés, erreurs évidentes filtrées. Cette étape discrète décide souvent du succès ou de l'échec – « garbage in » signifie réellement « garbage out ».
Ensuite, le système confronte les identifiants aux profils existants. Parfois la correspondance est évidente, parfois il faut décider s'il s'agit d'une nouvelle personne ou de la même sous une nouvelle forme. De ces décisions naît l'identity graph : une carte vivante qui montre comment différents identifiants se relient aux individus au fil du temps. De nouvelles données renforcent ou affaiblissent ces liens, d'anciennes hypothèses sont révisées. Enfin, des règles de réconciliation tranchent les conflits – par exemple quelle valeur conserver lorsque deux sources contiennent des informations différentes.
Vue d'ensemble : déterministe contre probabiliste
| Critère | Appariement déterministe | Appariement probabiliste |
|---|---|---|
| Base | Identifiants exacts (e-mail, téléphone) | Motifs statistiques et attributs |
| Précision | Très élevée, proche de 100 % | Moindre, avec score de confiance |
| Portée | Limitée, exige des ID fiables | Plus large, même sans ID exacts |
| Risque | Faible, facile à auditer | Faux liens sans calibrage |
| Recommandation | À utiliser en premier | En complément, à calibrer avec soin |
Questions fréquentes
Qu'est-ce que la résolution d'identité, simplement ?
C'est le processus qui relie des points de données fragmentés à travers les appareils, navigateurs, applications et canaux en un profil client unique. La même personne qui navigue anonymement sur mobile, ouvre un e-mail sur desktop et achète dans l'application apparaîtrait sinon comme plusieurs individus. La résolution d'identité reconnaît qu'il s'agit d'une seule personne et crée une vue unifiée.
Quelle différence entre appariement déterministe et probabiliste ?
L'appariement déterministe relie les enregistrements via des identifiants exacts comme l'e-mail ou le téléphone avec une certitude proche de 100 %, mais dépend d'ID fiables. L'appariement probabiliste utilise des algorithmes statistiques et des motifs comportementaux pour trouver des correspondances probables ; il couvre plus de cas, mais comporte un risque de faux liens et doit être soigneusement calibré.
Qu'est-ce qu'un identity graph ?
L'identity graph est une carte vivante qui montre comment différents identifiants – appareils, e-mails, ID – se relient aux personnes au fil du temps. De nouvelles données renforcent ou affaiblissent ces liens, et le graphe rend traçable quels identifiants ont conduit à un lien. Il est ainsi central pour les audits, le débogage des fusions erronées et la gouvernance.
Pourquoi le nettoyage des données est-il si important ?
Parce que l'appariement ne vaut que ce que valent les identifiants qu'il traite. Les e-mails doivent être normalisés, les numéros de téléphone standardisés et les erreurs évidentes filtrées avant tout lien. Cette étape paraît anodine, mais c'est précisément là que bien des stratégies échouent en silence : de mauvaises données d'entrée produisent des profils erronés ou en double – « garbage in, garbage out ».