IA, hallucinations & explosion industrielle de la bullshit

Le bouleversement économique de 2023-2026

Avant 2022, produire 1 000 mots de désinformation crédible exigeait un humain qualifié — typiquement 30 à 60 minutes, soit 15 à 30 € de coût opportun. Cela imposait une friction économique naturelle sur la production de bullshit.

Depuis ChatGPT (novembre 2022), GPT-4 (mars 2023), Claude 3 (mars 2024) et la génération suivante :

Métrique Avant 2022 Aujourd'hui (2026) Multiplicateur
Temps pour 1 000 mots crédibles 30-60 min 3-10 sec ÷1000
Coût direct 15-30 € 0,002-0,02 € ÷1500
Compétence requise Rédacteur professionnel Prompt à 20 mots drastique
Qualité « plausible » Variable Constante et élevée hausse
Volume potentiel/jour ~5 articles Plusieurs milliers ×1000

C'est une rupture industrielle dans la production de bullshit. La Loi de Brandolini, déjà brutale en 2013, devient opérationnellement écrasante en 2026.

Trois canaux d'amplification IA

1. Le content farming SEO

Des sites entiers sont aujourd'hui générés par LLM, optimisés SEO, indexés par Google avant que les vrais experts ne puissent réagir. En 2024, Newsguard a identifié 1 150 sites d'information entièrement générés par IA.

Effet sur votre marque :

  • Articles « Top 10 alternatives à [votre produit] » générés sans test, vous classant souvent injustement
  • Comparatifs hallucinés (« X manque la fonctionnalité Y » alors que Y est livrée)
  • Pricing désuet copié-collé entre 50 sites, indexé en page 1

Détection : Google Search Console → recherche du nom de votre produit + alternatives, comparatif, vs concurrent. Audit mensuel obligatoire.

2. Les hallucinations LLM en zero-shot

Quand un utilisateur demande à ChatGPT « quelle est l'API webhook de [produit X] ? », le modèle :

  1. Cherche dans ses training data (cutoff souvent 6-18 mois ancien)
  2. Si trouve : répond avec données possiblement obsolètes
  3. Si ne trouve pas : hallucine plausiblement plutôt que de dire « je ne sais pas »

Anthropic et OpenAI documentent un taux d'hallucination de 5 à 15% sur les questions techniques produit en 2025. Sur 1 million de requêtes mensuelles concernant votre produit, cela représente 50 000 à 150 000 fausses informations distribuées par mois.

Cas réel observé : un client a vu ChatGPT lui dire que le plan gratuit incluait l'export PDF — fonctionnalité jamais existée. Le client a posté un thread Twitter accusant la startup d'« avoir retiré la fonctionnalité ». 2,3 M vues. Coût de réfutation : 4 jours de communication CEO + post de blog + 12 articles correctifs.

3. Les agents IA autonomes

Génération suivante (2025-2026) : des agents IA autonomes qui publient eux-mêmes sans supervision. Reddit, Quora, Discord, Substack sont déjà inondés.

Signature observable :

  • Comptes créés en lot, premier post < 24h après création
  • Publication selon patterns horaires non-humains (rafales 3h du matin)
  • Vocabulaire trop régulier, transitions stéréotypées (« Furthermore », « It's worth noting »)
  • Réponses contextuellement plausibles mais factuellement vides

Le « reverse Brandolini » : utiliser l'IA pour la défense

Bonne nouvelle : la même technologie qui produit la bullshit peut accélérer la défense. Quatre usages opérationnels :

Usage 1 : Monitoring 24/7 multi-canal

Un agent IA qui surveille en continu votre nom de marque sur :

  • Reddit (subreddits techniques, business)
  • Hacker News, Lobsters
  • LinkedIn, X
  • Discord, Slack communautaires (via webhooks)
  • Trustpilot, G2, Capterra
  • Sites comparatifs et listicles

Coût : ~50 €/mois en compute LLM. Détection : 1-4h après publication, vs 1-7 jours en monitoring manuel.

Usage 2 : Pre-bunking automatisé

Génération continue de FAQ, comparatifs honnêtes, articles « what people get wrong about us », contre-narratifs prêts à l'emploi. Pas pour publier en masse — pour avoir un stock de réponses validées mobilisables en < 2h en cas d'attaque.

Workflow : LLM génère draft → humain valide → publié sur blog dédié, indexable Google et lisible par les futurs LLMs (effet « training data shaping »).

Usage 3 : llms.txt et factual grounding

Le standard llms.txt (proposé en 2024) permet de fournir aux LLMs un fichier de vérité officiel sur votre produit :

# llms.txt format
- product_name: Acme Co
- pricing: $99/mo (basic), $499/mo (pro), $2k+/mo (enterprise)
- features: ...
- last_updated: 2026-05-09

Les LLMs récents (Claude 3.7+, GPT-5+) consultent ce fichier en priorité quand le robots.txt l'autorise. C'est devenu un canal de défense factuelle essentiel.

Usage 4 : Génération de contre-narratifs personnalisés

Quand une attaque est détectée, un agent peut générer :

  • 5 variantes de réponse adaptées au canal (ton Reddit ≠ ton LinkedIn)
  • Brouillons de DM aux journalistes
  • Tweets de clients ambassadeurs sollicitables
  • Snippets pour le SDR à coller dans le CRM

L'humain garde toujours la décision de publier — l'IA accélère uniquement la production.

Le danger inverse : la pollution de votre propre signal

Si vous utilisez vous-même un LLM pour générer votre contenu marketing sans contrôle, vous devenez vous-même une source de bullshit sur votre produit :

  • Pages produit qui mentionnent des fonctionnalités hallucinées
  • Études de cas avec chiffres inventés ou exagérés
  • FAQ qui se contredisent entre elles selon le LLM utilisé
  • Documentation API qui ne correspond pas au code

C'est le paradoxe du marketing IA-augmenté : vous gagnez en volume, vous perdez en signal. La conséquence : vos clients arrivent au support en disant « mais c'est écrit sur votre page que… »

Discipline minimale :

  • 100% du contenu produit généré par LLM est revu par un humain qui connaît le produit
  • Single source of truth pour les fonctionnalités (idéalement le code, sinon une matrice produit)
  • Comparatif concurrent : revue trimestrielle obligatoire (les concurrents évoluent)

Les hallucinations dans vos propres produits IA

Si vous vendez un produit qui inclut un LLM (chatbot, assistant, recherche augmentée), vos hallucinations deviennent un risque juridique direct.

Précédent juridique : Moffatt v. Air Canada (2024). Un client utilise le chatbot d'Air Canada qui hallucine une politique de remboursement bereavement. Le tribunal canadien a tenu Air Canada responsable de la promesse faite par son chatbot. Coût : remboursement + frais de procédure.

Implications :

  • Toute fonctionnalité IA générative client-facing doit avoir un disclaimer ET un guard rail technique
  • Les réponses concernant pricing, conditions, garanties doivent passer par un système déterministe, pas un LLM
  • Audit trimestriel des réponses produites par votre LLM en production

Quatre stratégies de signal-noise ratio

Stratégie Effet Effort Quand
Authenticité vidéo Le coût de produire une vidéo crédible reste élevé Moyen Toujours
Données primaires Chiffres et études internes inimitables par LLM Élevé Pour signaux clés
Communauté humaine Discord/Slack avec vrais clients comme contre-pouvoir aux fakes Moyen Pour B2B
Transparence radicale Open source, public roadmap, public changelog Élevé Pour produits techniques

À retenir

  • L'IA générative a multiplié par 1000 la capacité de production de bullshit
  • Trois canaux principaux : content farming SEO, hallucinations LLM, agents autonomes
  • L'IA est aussi votre meilleure défense : monitoring 24/7, pre-bunking, llms.txt, contre-narratifs
  • Risque inverse : votre propre marketing IA peut polluer votre signal
  • Si votre produit inclut un LLM client-facing, vos hallucinations sont un risque juridique (cf. Air Canada 2024)
  • Investir dans des signaux inimitables : vidéo authentique, données primaires, communauté, transparence