Les Fondements de l'Heuristique de Représentativité

Quand la ressemblance écrase la probabilité

En 1972, deux jeunes chercheurs israéliens — Daniel Kahneman et Amos Tversky — publient un article au titre apparemment technique : « Subjective Probability: A Judgment of Representativeness ». Le constat est dévastateur pour l'image que la psychologie classique se faisait de la rationalité humaine.

Pour estimer la probabilité qu'un événement appartienne à une catégorie, l'esprit humain n'utilise pas la probabilité réelle. Il utilise la ressemblance à un prototype mental.

Autrement dit, quand votre cerveau doit décider si Marc, ce prospect croisé sur LinkedIn, va signer votre offre à 12 000 €, il ne calcule pas. Il compare Marc à une image mentale du « bon client » — et tranche en quelques centaines de millisecondes. La probabilité statistique réelle (le taux de base de signature à ce prix sur ce segment) est ignorée, écrasée par la ressemblance.

C'est l'heuristique de représentativité. Elle est la mère de la plupart de nos erreurs de qualification commerciale, de nos paris d'entrepreneur ratés, et — depuis 2022 — des hallucinations stéréotypées des grands modèles de langage. Sans elle, vous ne décideriez pas en moins d'une seconde. Avec elle, vous décidez vite mais souvent faux.

L'expérience fondatrice : le problème de Linda (Tversky & Kahneman, 1983)

Voici le problème classique tel qu'il était posé à des centaines d'étudiants de Stanford :

Linda a 31 ans, célibataire, franche et très brillante. Elle a fait des études de philosophie. Étudiante, elle s'est beaucoup investie dans les questions de discrimination et de justice sociale, et a participé à des manifestations antinucléaires.

Parmi les propositions suivantes, laquelle est la plus probable ?

a) Linda est caissière dans une banque. b) Linda est caissière dans une banque et militante du mouvement féministe.

85 % des répondants choisissent (b). C'est mathématiquement impossible. La probabilité d'être caissière ET féministe est forcément inférieure ou égale à celle d'être seulement caissière, puisque (b) est une sous-catégorie de (a). C'est ce que l'on appelle l'erreur de conjonction (conjunction fallacy).

Pourquoi cette erreur, alors que le sujet de l'expérience est un étudiant qui maîtrise les probabilités ? Parce que Linda ressemble plus à une « caissière féministe » qu'à une simple « caissière ». La ressemblance prend le pas sur la logique de Bayes.

« L'esprit qui veut être rapide remplace systématiquement une question difficile (quelle est la probabilité ?) par une question facile (à quel point ça ressemble ?). » — Kahneman, Thinking, Fast and Slow, 2011.

La formulation moderne

L'heuristique de représentativité s'énonce ainsi :

Quand on doit juger la probabilité qu'un objet A appartienne à une classe B, le cerveau utilise comme proxy le degré de ressemblance entre A et le prototype de B, en négligeant trois informations clés : le taux de base, la taille d'échantillon, et la régression à la moyenne.

Notez les trois angles morts qui en découlent et que nous allons disséquer :

  1. Négligence des taux de base (base-rate neglect) — « Cette personne ressemble à un médecin → c'est probablement un médecin », en oubliant qu'il y a 100 fois plus d'enseignants que de médecins dans la population.
  2. Négligence de la taille d'échantillon« 3 ventes sur 5 démos → mon nouveau pitch convertit à 60 % », en oubliant que 5 n'a aucune valeur statistique.
  3. Négligence de la régression à la moyenne« Ce commercial a fait un mois exceptionnel → on lui confie le portefeuille stratégique », en oubliant que les exceptionnels reviennent vers la moyenne.

Les 4 manifestations clés en business

graph TD
    A[Heuristique de représentativité] --> B[Erreur de conjonction]
    A --> C[Négligence du taux de base]
    A --> D[Insensibilité à la taille d'échantillon]
    A --> E[Confusion ressemblance / causalité]
    B --> F[« Bon client » trop spécifique]
    C --> G[Stéréotypage prospect]
    D --> H[Décisions sur 3 témoignages]
    E --> I[Pattern matching pipeline]
Manifestation Forme business typique Coût
Erreur de conjonction « Mon client idéal : CTO, série A, équipe 20+, basé Paris, scale-up SaaS B2B... » → vous excluez 80 % du marché atteignable Sous-pipeline
Négligence taux de base « Cet appel ressemble à mes deals gagnés → il va signer » alors que ce segment ferme à 4 % Forecast faux
Échantillon trop petit « 3 témoignages positifs → on garde la feature » Investissement dans le bruit
Régression à la moyenne « Notre meilleur SDR a explosé → on lui donne le team lead » Pic isolé pris pour signal

Le test de Bayes : ce que votre cerveau refuse de faire

Imaginons un cas business concret. Une école de code annonce avoir formé 80 % de développeurs « excellents » selon ses propres mesures.

Question : si on tire au sort un dev sur le marché qui a fait cette école, quelle est la probabilité qu'il soit excellent ?

La plupart répondent 80 %. C'est faux. Il faut intégrer :

  • Le taux de base d'« excellents » dans la population générale des devs : disons 20 %.
  • La sensibilité du test (taux de vrais positifs) : 80 %.
  • La spécificité (taux de vrais négatifs) : 80 %.

Le théorème de Bayes donne :

P(Excellent | Sortant) = P(Sortant | Excellent) × P(Excellent) / P(Sortant)
                       = 0.80 × 0.20 / (0.80 × 0.20 + 0.20 × 0.80)
                       = 0.50

Vous avez en fait 50 % de chances, pas 80 %. La moitié de votre certitude est une illusion représentative. C'est exactement le piège dans lequel tombent les recruteurs, les VCs, les commerciaux et tous les humains qui font des paris sur des humains.

Les racines neurobiologiques

Le système de catégorisation rapide

Le cerveau humain catégorise un visage en 170 millisecondes (Thorpe et al., 1996). Cette vitesse est rendue possible par un système qui compare à un prototype mémoire, pas par calcul statistique. Le gyrus fusiforme et le cortex temporal inférieur jouent ici un rôle central — ils détectent la ressemblance avant que la conscience ne soit informée.

L'économie cognitive

Estimer une probabilité bayésienne réelle consomme un effort énorme (Système 2 selon Kahneman). Le cerveau, pour économiser sa glucose, préfère le shortcut : « ça ressemble à X → c'est X ». Cette préférence est tellement forte qu'elle persiste même quand on donne au sujet la bonne information statistique. C'est ce qu'on appelle la résistance au taux de base.

Le déclenchement dopaminergique de la reconnaissance

Quand le cerveau reconnaît un pattern familier (un visage, une situation, un prospect), il libère un petit pic de dopamine. Cette récompense renforce l'usage de la ressemblance comme outil de décision — c'est pourquoi les commerciaux expérimentés sont plus sujets à la représentativité que les juniors : ils ont plus de prototypes mémorisés et plus de dopamine à gagner à les utiliser.

Distinction représentativité / disponibilité / ancrage

Trois heuristiques de Kahneman souvent confondues :

Heuristique Question implicite Exemple
Représentativité À quoi ça ressemble ? « Ce prospect ressemble à un closer signé »
Disponibilité Quels exemples me viennent ? « Je me souviens de 3 deals comme ça récemment »
Ancrage Mon point de référence est ? « Le prospect a annoncé 100k de budget »

La représentativité est la plus invisible des trois : elle opère avant que vous ayez conscience d'avoir évalué. C'est pour cela qu'elle est la plus difficile à débiaiser.

Pourquoi l'IA aggrave (et soigne) cette heuristique

À l'ère des LLM, deux dynamiques contradictoires émergent :

LLMs entraînés sur du texte humain → reproduisent la représentativité humaine
Mais bien promptés → corrigent le taux de base mieux que vous
  • Mauvais usage IA : « Génère-moi un profil de client idéal » → l'IA renvoie un stéréotype maximisé sur la ressemblance.
  • Bon usage IA : « Calcule la probabilité bayésienne que ce lead signe, sachant un base rate de 4 %, un fit produit de 0.7 et une intention détectée de 0.6 » → l'IA fait le calcul que votre cerveau refuse.

C'est précisément cette dualité que vous allez apprendre à manier.

Hawthorne en business : le pattern matching qui ruine vos forecasts

Domaine Manifestation représentativité
Vente B2B Le prospect ressemble au dernier deal gagné → MQL noté SQL → cycle pourri
Recrutement CV qui « sent le bon profil » → embauche → mismatch à 6 mois
Investissement Pitch deck qui ressemble à Stripe → fonds engagé → produit n'a pas le PMF
Pricing « Cette feature ressemble à du Notion → 8 €/mois » → on rate la value-based
Marketing Persona basée sur 3 interviews → campagne mal ciblée
Coaching « Tu ressembles à un junior bloqué → fais X » → cadrage faux

Ce que vous allez apprendre

Chapitre Contenu
Mécanismes psycho Prototype, conjonction, taux de base, régression, neurosciences
Applications vente Qualification ICP, scoring, débiaisage des forecasts
IA & représentativité LLM, stéréotypes, prompts bayésiens, RAG correcteur
Entrepreneuriat Décisions stratégiques, recrutement, pricing, fundraising

Résumé

L'heuristique de représentativité, formalisée par Kahneman et Tversky entre 1972 et 1983, démontre que le cerveau humain juge les probabilités par ressemblance à un prototype, en ignorant les taux de base, la taille d'échantillon et la régression à la moyenne. Elle produit l'erreur de conjonction (Linda) et le piège bayésien (l'école de code à 80 %). Elle est ancrée dans la catégorisation rapide du cortex temporal et récompensée dopaminergiquement, ce qui la rend particulièrement résistante au débiaisage volontaire. En business, elle pollue les forecasts de vente, les recrutements, les décisions d'investissement et — depuis peu — les sorties de LLM mal promptés. Dans le prochain chapitre, nous démontons en profondeur les mécanismes psychologiques qui rendent cette heuristique si puissante et si trompeuse.