Les Mécanismes Psychologiques : Prototype, Conjonction et Taux de Base

Du prototype au jugement : l'anatomie du raccourci

Pour saisir pourquoi la représentativité est aussi puissante — et aussi traîtresse — il faut descendre dans la mécanique cognitive précise qui la produit. Cette mécanique repose sur quatre piliers psychologiques qui s'enchaînent en quelques centaines de millisecondes.

graph LR
    A[Stimulus] --> B[Activation du prototype]
    B --> C[Mesure de ressemblance]
    C --> D[Substitution heuristique]
    D --> E[Jugement de probabilité]
    E --> F[Ignorance des taux de base]

Pilier 1 — La théorie du prototype (Eleanor Rosch, 1973)

Avant Kahneman et Tversky, la psychologue Eleanor Rosch a démontré que les catégories humaines ne sont pas définies par des règles binaires (« a 4 pattes ET aboie → chien ») mais par un prototype central. Un golden retriever est un meilleur prototype de « chien » qu'un chihuahua, qui lui-même est meilleur qu'un loup. Les humains classent plus vite les exemplaires proches du prototype.

Conséquence en vente : votre cerveau a un « prototype du client qui signe », élaboré inconsciemment à partir de vos 30 derniers deals gagnés. Tout nouveau prospect est jugé par sa distance à ce prototype. Un prospect atypique mais en réalité très qualifié sera sous-estimé par votre intuition. Un prospect très ressemblant au prototype mais en réalité de mauvaise qualité sera surestimé.

Le piège : la dérive du prototype

Le prototype mémoire n'est pas statique. Il dérive avec l'expérience récente (effet de récence). Une série de 3 deals gagnés dans le secteur public et votre cerveau reformate silencieusement le prototype vers « secteur public ». Vos prospects privés qualifiés sont alors filtrés défavorablement, sans que vous en ayez conscience.

Une étude de Salesforce (2019) a montré que les vendeurs surestiment de 28 % la probabilité de signature des prospects partageant les caractéristiques explicites des 5 derniers deals gagnés.

Pilier 2 — L'erreur de conjonction (Tversky & Kahneman, 1983)

Reprenons Linda. La force de l'erreur de conjonction tient à un mécanisme précis : plus une description est riche et cohérente, plus elle paraît probable, alors que mathématiquement c'est l'inverse.

Plus on ajoute de détails à une histoire, plus elle devient crédible à nos yeux — et moins elle est probable statistiquement.

C'est ce qu'on appelle la substitution d'attribut : le cerveau remplace la question « est-ce probable ? » (difficile) par « est-ce que ça colle ? » (facile).

En vente : le scénario commercial qui sonne juste

Un commercial décrit à son sales manager :

« Le prospect a un projet de migration cloud, il a confirmé un budget de 50 k, le DSI a donné son go, le procurement a déjà validé le contrat type, on a une recommandation interne d'un ancien client, et on est en POC actif. »

Plus la description est riche, plus le manager est convaincu que ce deal va signer. Mais chaque condition ajoutée divise la probabilité réelle :

P(tout signer) = P(budget) × P(GO DSI | budget) × P(procurement OK) × ... 
              < P(budget) seul

Le scénario qui sonne le plus probable est mathématiquement le moins probable. C'est le piège du deal-narratif-trop-beau.

Pilier 3 — La négligence des taux de base (base-rate neglect)

C'est la manifestation la plus coûteuse de la représentativité. Tversky et Kahneman (1973) l'ont illustrée avec le problème du taxi :

Dans une ville, 85 % des taxis sont verts et 15 % bleus. Un témoin identifie un taxi impliqué dans un accident comme bleu. Sa fiabilité d'identification est de 80 %.

Quelle est la probabilité que le taxi soit réellement bleu ?

L'intuition dit 80 %. La réponse correcte est 41 %. Bayes intègre que les bleus sont rares au départ — donc même avec une identification fiable à 80 %, on aura beaucoup plus de faux positifs (taxis verts identifiés comme bleus) que de vrais positifs.

La formule à connaître

P(Bleu | Identifié Bleu) = P(Identifié Bleu | Bleu) × P(Bleu)
                        / [P(Id Bleu | Bleu) × P(Bleu) + P(Id Bleu | Vert) × P(Vert)]
                        = 0.80 × 0.15 / (0.80 × 0.15 + 0.20 × 0.85)
                        = 0.12 / 0.29 = 0.41

Application en sales ops

Si votre taux de conversion historique (taux de base) sur un segment donné est de 4 %, et que votre scoring IA identifie un lead « chaud » avec une fiabilité de 80 %, la probabilité réelle de signature reste autour de 14 %, pas de 80 %.

Combien de pipelines sont gonflés parce que l'équipe commerciale multiplie le score chaud par 100 au lieu d'appliquer Bayes ?

Pilier 4 — L'insensibilité à la taille d'échantillon

Tversky et Kahneman (1971) ont étudié la « loi des petits nombres » : les humains croient que les petits échantillons sont aussi représentatifs que les grands. C'est faux statistiquement, mais cognitivement irrésistible.

L'exemple du landing page

Vous lancez deux variantes A/B d'une landing page :

  • Variante A : 80 visiteurs → 8 conversions → 10 %
  • Variante B : 40 visiteurs → 6 conversions → 15 %

Votre cerveau crie « B gagne ! ». La réalité statistique : avec ces tailles d'échantillon, la différence n'est pas significative (intervalle de confiance qui se chevauche). Lancer la version B en généralisée serait un pari aveugle.

Conséquence : la « kill room » des startups

Combien de features sont gardées (ou tuées) sur des micro-études utilisateurs (n=5) qui ne disent statistiquement rien ? La représentativité fait croire qu'un échantillon de 5 est suffisamment représentatif pour décider — alors que pour détecter une différence de 5 points de pourcentage avec puissance 0.8 et p<0.05, il en faut souvent 500 à 1 500.

Pilier 5 — La méconnaissance de la régression à la moyenne

Galton (1886), redécouverte par Kahneman : les valeurs extrêmes tendent à se rapprocher de la moyenne lors des mesures suivantes — non pas pour une raison « causale », mais simplement parce qu'elles contenaient du bruit.

En coaching commercial

Un commercial fait un mois exceptionnel à +180 % de quota. Son manager le félicite et change rien (intuition correcte : « on continue ce qui marche »). Le mois suivant, il fait +90 %. Le manager pense : « j'aurais dû le coacher, il a relâché ». Erreur : il a juste régressé vers la moyenne.

Inversement : un commercial qui plonge à -40 % est coaché intensivement. Le mois d'après, il fait -5 %. Le manager attribue l'amélioration au coaching. Encore erreur : c'est la régression naturelle qui a fait le travail.

Kahneman raconte dans Thinking, Fast and Slow comment il a découvert ce mécanisme en formant des pilotes de l'armée israélienne : les instructeurs croyaient que la critique fonctionnait mieux que l'éloge — alors que c'était simplement la régression vers la moyenne qu'ils observaient.

Le débiaisage : ce qui marche, ce qui ne marche pas

Ce qui ne marche pas (ou très peu)

  • L'éducation statistique simple : savoir que le biais existe ne suffit pas à l'éviter (Kahneman l'a dit lui-même : « j'ai 50 ans d'études sur ces biais et je continue à les commettre »).
  • L'expérience accumulée : elle renforce le prototype, donc renforce la représentativité.
  • La méta-cognition seule : se dire « je vais être plus rationnel » échoue car le biais opère avant la conscience.

Ce qui marche (modérément)

Technique Mécanisme Coût d'implémentation
Forcing bayésien Imposer le calcul explicite : base rate × sensibilité Élevé (besoin d'outils)
Vues contre-prototype Lister 3 deals gagnés qui ne ressemblaient pas au prototype Faible
Pre-mortem (Klein) « Imaginez que ce deal a échoué — pourquoi ? » Faible
Décision par référence externe Comparer le cas présent à la classe de cas similaires (outside view) Moyen
Délai de décision Imposer un temps de latence (1h, 24h) Faible
Délégation à un agent IA Faire calculer la probabilité par un modèle entraîné Moyen-élevé

Les facteurs qui amplifient le biais

Comme tous les biais, la représentativité est modulable. Voici les conditions qui la rendent maximale :

  1. Fatigue cognitive : un commercial en fin de journée utilise 3 fois plus la représentativité qu'en début (Danziger, Levav & Avnaim-Pesso, 2011 — parole boards israéliens).
  2. Pression temporelle : moins de 30 secondes pour juger → représentativité à 90 %.
  3. Charge cognitive forte : multitâche, interruptions → représentativité prend la main.
  4. Familiarité du domaine : plus on est expert, plus le prototype est riche, plus la représentativité s'active vite.
  5. Émotion positive : sentiment de connivence avec le prospect → ressemblance amplifiée.

Représentativité chez l'expert vs le novice

Novice : peu de prototypes → représentativité faible mais lente → erreurs aléatoires
Expert : nombreux prototypes → représentativité rapide → erreurs systématiques

Paradoxe documenté par Klein (2003) sur les pompiers et les chirurgiens : l'expert se trompe moins sur le diagnostic général, mais plus sur les cas atypiques que le novice. Pourquoi ? Parce que le novice applique encore les règles bayésiennes apprises, là où l'expert s'en remet à la ressemblance.

C'est exactement pour cela qu'un sales senior peut avoir un forecast pire qu'un junior bien outillé.

Les neurosciences de la représentativité

Le cortex préfrontal ventro-médial (vmPFC)

C'est la zone qui évalue la cohérence narrative d'une information. Plus elle s'active, plus l'histoire « sonne juste » — et plus la conjonction nous paraît probable. Le vmPFC ne calcule pas Bayes : il calcule de la plausibilité narrative.

L'hippocampe et la complétion mémoire

Quand votre cerveau perçoit un détail (ex : « ce prospect a fait HEC »), l'hippocampe complète automatiquement avec un prototype mémoire (« ... donc ambitieux, rapide à décider, budget important »). Ce phénomène, appelé pattern completion, est ce qui rend la représentativité quasi-impossible à neutraliser consciemment.

L'amygdale et la confiance émotionnelle

Quand une description « colle » au prototype, l'amygdale envoie un signal de sécurité épistémique« on tient quelque chose ». Cette dopamine de reconnaissance renforce le biais en le rendant agréable à éprouver. Vous aimez reconnaître. Vous aimez avoir compris vite.

Le piège de la représentativité dans les outils IA

Les modèles de langage modernes (GPT-4, Claude, Llama) ont été entraînés sur du texte humain massif. Ils reproduisent les heuristiques de représentativité humaines à grande échelle :

  • Demander à un LLM « écris un profil de Marc, ingénieur tech à Lyon » → il produira un profil stéréotypé maximisant la ressemblance prototypique.
  • Demander « est-ce un bon lead ? » → il produira un jugement basé sur la ressemblance, pas sur Bayes — sauf si on le force explicitement à raisonner statistiquement.

Cette propriété sera centrale dans le chapitre 5.

Résumé

L'heuristique de représentativité repose sur cinq mécanismes intriqués : la théorie du prototype (Rosch), la substitution d'attribut qui remplace la probabilité par la ressemblance, la négligence des taux de base (Bayes ignoré), l'insensibilité à la taille d'échantillon (loi des petits nombres) et la méconnaissance de la régression à la moyenne. Ces mécanismes sont enracinés dans des structures neurobiologiques (vmPFC, hippocampe, amygdale) qui les rendent rapides, agréables et invisibles. Ils sont aggravés par la fatigue, la pression temporelle, et — paradoxalement — par l'expertise. Les débiaiser passe par des protocoles explicites (forcing bayésien, vues contre-prototype, pre-mortem, délégation IA bien promptée). Dans le prochain chapitre, un quiz vous permettra de vérifier que ces fondements sont solidement ancrés avant d'aller en application terrain.