IA & Représentativité : LLM, Stéréotypes et Prompts Bayésiens
La grande contradiction des LLM
Les modèles de langage modernes (GPT-4, Claude, Gemini, Llama, Mistral) ont été entraînés sur une masse colossale de texte humain. Cette masse contient à la fois :
- La connaissance statistique du monde (encyclopédies, articles scientifiques, données)
- L'ensemble des biais cognitifs humains exprimés en langage (réseaux sociaux, fictions, opinions, raccourcis)
Résultat : un LLM est à la fois une mine de bayésien et un amplificateur de représentativité. Selon la manière dont vous le promptez, il fait basculer le curseur.
Une question vague à un LLM → il répond par prototype. Une question forcée vers le calcul → il répond par Bayes.
Maîtriser cette dualité, c'est transformer l'IA en outil de débiaisage à grande échelle — ou la laisser amplifier vos biais à 1 000 prompts par jour.
Le mécanisme : pourquoi un LLM est représentativiste par défaut
L'entraînement statistique sur le langage humain
Un LLM apprend à prédire le token le plus probable sachant les précédents. Cette probabilité est calculée sur un corpus humain — donc elle reflète la distribution des prototypes humains, pas la distribution réelle des phénomènes.
Exemple concret : si vous demandez à un LLM « décris un développeur dans une startup à San Francisco », il produira un portrait stéréotypé (homme, 25-35 ans, hoodie, café d'origine, mécanique startup). Pourquoi ? Parce que le texte d'entraînement parle plus souvent de ce prototype que de la réalité diverse du métier.
Distribution réelle du métier : large, variée
Distribution dans le texte web : concentrée sur le prototype
LLM apprend la distribution web → reproduit le prototype
Les hallucinations comme erreur de conjonction
Une partie significative des « hallucinations » des LLM sont en fait des erreurs de conjonction : le modèle combine plusieurs traits qui « collent » à un prototype pour produire une affirmation plausible mais fausse.
Exemple : « Albert Einstein a publié sa théorie de la relativité restreinte en 1905 à l'âge de 26 ans, depuis son bureau de l'Office des brevets à Berne, où il a également collaboré avec Marie Curie. »
La dernière clause est fausse — mais elle ressemble à ce qu'un texte sur Einstein contiendrait. Le LLM a fait du pattern completion prototypique, exactement comme un humain.
Le piège n°1 : les profils générés stéréotypés
L'erreur
Vous demandez à votre LLM préféré :
« Crée-moi le persona du client idéal pour mon SaaS de gestion de freelances. »
Vous obtenez un profil hyper-cohérent et hyper-stéréotypé : « Marc, 34 ans, développeur freelance basé à Lyon, 45 €/h, utilise Notion, écoute Lex Fridman, son besoin principal est de gagner du temps sur sa facturation... ». C'est crédible. C'est faux. C'est la conjonction de tous les prototypes du LLM sur ce sujet.
Le coût business
- Persona trop spécifique → exclusion du marché atteignable
- Erreur de conjonction → personne ne matche en pratique
- Coaching marketing biaisé → mauvaises hypothèses de produit
La correction par prompt
[Mauvais prompt]
« Crée le persona du client idéal pour mon SaaS X »
[Bon prompt — anti-représentativité]
« Liste 12 personas réalistes pour un SaaS X.
Pour chaque persona, donne sa probabilité approximative
dans la base atteignable (en % de marché potentiel),
ses 3 contre-traits inattendus (qui détonent du prototype),
et un cas concret où il N'achète pas malgré le fit apparent.
Ne propose pas un seul persona. »
Ce prompt force le LLM à distribuer au lieu de prototyper.
Le piège n°2 : le scoring de leads naïf
L'erreur
Vous nourrissez votre LLM avec un lead :
« Marie, CMO chez une scale-up B2B, 50 employés, série A, basée à Paris, télécharge mon e-book. Évalue ce lead. »
Le LLM répond : « Lead très qualifié, score 9/10. CMO + scale-up + télécharge contenu → forte probabilité d'achat. »
C'est de la représentativité pure. Le LLM compare Marie à son prototype de « bon lead » et donne un score. Aucun Bayes, aucun taux de base.
La correction : forcer le calcul bayésien
[Bon prompt — bayésien explicite]
« Évalue ce lead. Avant de produire un score, calcule :
1. Base rate : sur 100 CMO d'une scale-up B2B série A
qui téléchargent ce type d'e-book, combien signent
un contrat à 18 000 € dans les 90 jours ? (Estime entre 0,5 % et 8 %.)
2. Sensibilité : si le lead va signer, quelle est la P
qu'il télécharge ce contenu ? (Estime.)
3. Spécificité : si le lead ne va PAS signer, quelle est la P
qu'il télécharge quand même ? (Estime.)
4. Applique Bayes et donne-moi la probabilité postérieure
réelle de signature.
5. Donne ensuite, séparément, ton intuition représentative
pour comparaison. »
Le LLM, ainsi forcé, produit deux scores qui peuvent diverger de 20 à 40 points. La probabilité postérieure réelle est presque toujours plus basse que l'intuition. C'est ce gap qui sauve votre forecast.
Le piège n°3 : la génération de contenu prototypique
L'erreur
Demande typique d'un marketeur :
« Écris-moi 10 hooks pour mon post LinkedIn sur l'IA en B2B. »
Le LLM produit 10 hooks qui se ressemblent tous — parce qu'il a appris le prototype du bon hook LinkedIn sur son corpus. Résultat : votre post fond dans la masse.
La correction : forcer le contre-prototype
[Bon prompt — anti-mimétisme]
« Écris 10 hooks pour mon post LinkedIn sur l'IA en B2B.
Contraintes anti-prototype :
- 3 doivent commencer par une statistique précise non-évidente
- 3 doivent contredire une croyance prototypique sur le sujet
- 2 doivent partir d'un détail très spécifique (anti-conjonction de Linda)
- 2 doivent être des questions ouvertes
- AUCUN ne doit commencer par "5 erreurs que" ou "Voici comment"
- AUCUN ne doit utiliser les emojis 🚀 🔥 ✨
Vise la divergence stylistique maximale entre les 10. »
L'output est radicalement différent — et significativement plus performant en taux de clic (Buffer benchmark interne, 2024).
Le piège n°4 : les décisions stratégiques par LLM
L'erreur de l'oracle représentativiste
Vous demandez à un LLM :
« Devrais-je lever des fonds maintenant ou continuer en bootstrap ? »
Le LLM répond avec une analyse cohérente et confiante. Mais cette analyse repose sur le prototype de la situation que vous décrivez, pas sur votre situation réelle.
La correction : forcer l'outside view de Kahneman
[Bon prompt — outside view]
« Pour cette décision, applique strictement la méthode
outside view de Kahneman :
1. Définis la classe de référence (ex: SaaS B2B, 500k ARR,
équipe de 4, marché concurrentiel).
2. Donne-moi le base rate de réussite des deux options
dans cette classe sur 5 ans (sources si possible).
3. Identifie 3 facteurs de mon cas qui dévient de la base rate
et leur amplitude (chacun en + ou - x %).
4. Calcule la probabilité ajustée pour les deux options.
5. Donne ta recommandation, en précisant l'incertitude
autour du chiffre. »
Ce protocole transforme le LLM d'oracle prototype en calculateur bayésien — qui reste imparfait, mais infiniment plus utile.
Le RAG (Retrieval-Augmented Generation) comme correcteur de représentativité
Un LLM seul n'a pas vos taux de base. Il peut les inventer, mais il ne les connaît pas. C'est là que le RAG devient un outil de débiaisage massif :
[Architecture RAG anti-représentativité]
1. Vector store des données factuelles de l'entreprise :
- Historique de conversion par segment
- Taux de churn par profil client
- Performance pricing par feature
2. Au moment du prompt :
- Le système récupère les chiffres factuels pertinents
- Les injecte dans le contexte du LLM
- Force la réponse à les utiliser explicitement
3. Output : réponse bayésienne avec taux de base réel
Une équipe sales équipée d'un RAG avec ses propres base rates bat systématiquement une équipe équipée du même LLM sans RAG.
Les biais de représentativité spécifiques aux LLM
Le biais de canonicité
Les LLM préfèrent les exemples canoniques (Stripe pour SaaS, Tesla pour EV, OpenAI pour IA). Demandez « cite un exemple de scale-up qui a réussi son pricing » → vous aurez Stripe. Toujours.
Correction : demandez explicitement « cite 5 exemples non-canoniques ».
Le biais de récence d'entraînement
Plus un événement est postérieur au cut-off d'entraînement, plus le LLM est mauvais à le récupérer. Il invente des prototypes plausibles à la place. Correction : forcer le LLM à dire « je ne sais pas » explicitement quand la date dépasse son knowledge cutoff.
Le biais de symétrie syntaxique
Si vous demandez « compare A et B », le LLM produira un nombre égal d'arguments pour chaque côté, même si la vérité est asymétrique. Correction : demander explicitement le poids relatif de chaque côté.
Le framework prompting anti-représentativité (cheat-sheet)
| Pratique à risque | Pratique corrigée |
|---|---|
| « Évalue ce lead » | « Calcule P bayésienne avec base rate explicite » |
| « Crée le persona » | « Distribue 12 personas avec contre-traits » |
| « Écris des hooks » | « Contraindre 5 sous-styles divergents » |
| « Recommande X ou Y » | « Outside view + base rate de la classe » |
| « Quels sont les bons exemples ? » | « Cite 3 canoniques et 5 non-canoniques » |
| « Es-tu sûr ? » | « Donne l'incertitude en intervalle de confiance » |
Les futures architectures : l'IA bayésienne native
Les recherches récentes (Anthropic, DeepMind, MIT 2024) explorent des architectures où le LLM délègue les jugements probabilistes à un module bayésien externe. Le LLM produit le raisonnement langagier, le module produit la probabilité. Cette séparation pourrait être le grand saut anti-représentativité des deux prochaines années.
En attendant, c'est par le prompting que vous orchestrez la séparation manuellement.
Cas d'usage : automatiser le débiaisage commercial
graph TD
A[Nouveau lead CRM] --> B[Trigger n8n / Make]
B --> C[Prompt LLM bayésien avec base rate]
C --> D[Score probabilité postérieure]
D --> E[Comparaison au score intuitif commercial]
E --> F{Gap > 30 pts ?}
F -->|Oui| G[Alerte revue manuelle]
F -->|Non| H[Mise à jour pipeline]
Ce pipeline simple, sans LLM frontline, génère une deuxième opinion bayésienne sur chaque lead — et alerte uniquement quand l'intuition commerciale diverge fortement du calcul. C'est de la précision sans friction.
Résumé
Les LLM modernes sont des amplificateurs de représentativité par défaut : entraînés sur du texte humain, ils reproduisent les prototypes et les erreurs de conjonction de leurs entraîneurs humains. Mais correctement promptés, ils deviennent les plus puissants outils de débiaisage bayésien jamais disponibles. La clé tient en quatre pratiques : forcing bayésien explicite, contre-prototype actif, outside view formelle, et RAG sur des taux de base internes. Les hallucinations sont souvent des conjonctions prototypiques — le promptage anti-représentativité les réduit drastiquement. Couplé à des workflows d'automatisation, ce débiaisage devient industrialisable et offre 15 à 30 % de précision de forecast et de qualité de contenu. Dans le prochain chapitre, nous montrerons comment cette discipline s'applique aux décisions d'entrepreneuriat — pricing, recrutement, levée de fonds — où la représentativité fait perdre des millions chaque année à ceux qui s'y abandonnent.