Les Fondements de la Loi de Goodhart

La phrase qui hante toutes les salles de COMEX

« Quand une mesure devient une cible, elle cesse d'être une bonne mesure. »

Marilyn Strathern, 1997 — reformulation du principe énoncé par Charles Goodhart en 1975.

Cette phrase, vous l'avez peut-être déjà vue collée sur un mur de open-space, citée par un VP Engineering ou tweetée par un ingénieur OpenAI. Mais derrière sa formulation presque taoïste se cache l'un des principes les plus universellement violés du management moderne — et l'un des angles morts les plus dangereux à l'ère de l'IA.

Car aujourd'hui, vous n'optimisez plus seul vos métriques. Vos commerciaux les optimisent. Vos algorithmes les optimisent. Vos LLMs les optimisent. Tous, en silence, en parallèle, sans coordination. Et tous, sans s'en rendre compte, transforment votre mesure en cible — donc en mensonge.

Ce module vous apprend à voir cette dérive avant qu'elle ne consomme votre business.

La formulation originale de Goodhart (1975)

L'économiste Charles Goodhart, alors conseiller à la Banque d'Angleterre, observait dans les années 1970 que chaque fois que la banque centrale britannique adoptait un agrégat monétaire (M0, M1, M3…) comme cible de politique monétaire, cet agrégat se mettait à se comporter bizarrement — il décrochait de la grandeur économique qu'il était censé représenter.

Sa formulation originale, dans un papier de 1975 (« Problems of Monetary Management: The U.K. Experience »), est plus technique :

« Any observed statistical regularity will tend to collapse once pressure is placed upon it for control purposes. »

Toute régularité statistique observée tend à s'effondrer dès qu'on lui applique une pression à des fins de contrôle.

C'est la version économétrique de la loi. Marilyn Strathern, anthropologue de Cambridge, la reformulera en 1997 dans sa version aphoristique — celle qui est devenue virale.

Pourquoi la mesure se dégrade : 4 mécanismes

graph TD
    A[Mesure devient cible] --> B[Pression sur l'acteur]
    B --> C[Mécanisme 1<br/>Spécification incomplète]
    B --> D[Mécanisme 2<br/>Sélection adverse]
    B --> E[Mécanisme 3<br/>Optimisation locale]
    B --> F[Mécanisme 4<br/>Gaming explicite]
    C --> G[Dérive du proxy]
    D --> G
    E --> G
    F --> G
    G --> H[La mesure ne reflète plus la réalité]

1. Spécification incomplète (« proxy gap »)

Aucune métrique ne capture jamais entièrement la valeur qu'elle prétend mesurer. Le chiffre d'affaires ne mesure pas la rentabilité ; le NPS ne mesure pas la fidélité réelle ; le nombre de réunions ne mesure pas la productivité.

Tant que la mesure est observée passivement, l'écart proxy ⟷ valeur réelle reste stable. Dès qu'on la cible, les acteurs optimisent le proxy, pas la valeur. L'écart explose.

2. Sélection adverse

Une cible attire les acteurs qui savent l'optimiser — pas ceux qui créent de la valeur. Récompenser les commerciaux uniquement sur le nombre de RDV pris ? Vous attirerez et garderez les meilleurs preneurs de RDV, pas les meilleurs closeurs.

3. Optimisation locale (effet Campbell)

Donald T. Campbell, sociologue américain, énonça en 1976 une loi sœur :

« Plus une mesure quantitative est utilisée pour la prise de décision, plus elle sera sujette à la corruption et plus elle déformera et corrompra le processus social qu'elle est censée mesurer. »

Les acteurs réallouent leur énergie vers le proxy au détriment de tout le reste. Le score monte, la valeur s'effondre.

4. Gaming explicite

Le cas extrême : on triche. Maquillage de CRM, lead inflation, fausses signatures, faux clics, contenus IA mal étiquetés. Gaming = la cible est devenue l'objectif principal et la valeur sous-jacente est devenue secondaire.

La taxonomie de Manheim & Garrabrant (2018)

Dans un article fondateur, « Categorizing Variants of Goodhart's Law », David Manheim et Scott Garrabrant (du Machine Intelligence Research Institute) distinguent quatre variantes de la loi — taxonomie devenue référence dans la communauté AI alignment.

Variante Mécanisme Exemple sales/business
Regressional Goodhart Le proxy est bruité ; on sélectionne sur le bruit, pas le signal Recruter les commerciaux au score le plus élevé d'un test — souvent du bruit
Causal Goodhart On confond corrélation et causalité ; on optimise une cause non-réelle Augmenter le nombre d'emails envoyés parce qu'il corrèle avec le CA
Extremal Goodhart La relation proxy/valeur tient sur la plage observée, pas aux extrêmes Pousser un NPS à 90 alors qu'on ne sait pas ce qui se passe au-delà de 70
Adversarial Goodhart Un agent intelligent (humain ou IA) optimise activement le proxy Le commercial qui force des deals à 1€ pour booster son volume

Cette taxonomie est cruciale : chaque variante demande une parade différente. Confondre un Causal Goodhart avec un Adversarial Goodhart, c'est se tromper de remède.

Le précédent de Lucas (économétrie)

Avant Goodhart, l'économiste Robert Lucas (Nobel 1995) avait énoncé la critique de Lucas (1976) : les paramètres économétriques estimés à partir de données passées changent quand la politique économique change. C'est-à-dire : on ne peut pas piloter une économie en partant du principe que les agents continueront à se comporter comme avant — ils s'adaptent à la politique.

Goodhart, Lucas, Campbell : trois énoncés convergents d'un même principe profond — les systèmes humains (et désormais les systèmes IA) sont réflexifs. Ils incorporent la mesure dans leur comportement.

L'effet cobra : la métaphore légendaire

Pendant l'occupation britannique de l'Inde, le gouverneur de Delhi voulut réduire la population de cobras. Il instaura une prime pour chaque cobra mort apporté à l'administration.

D'abord, ça marche : les habitants tuent les cobras sauvages. Ensuite, ça déraille : ils se mettent à élever des cobras chez eux pour les tuer et toucher la prime. Le gouvernement supprime la prime. Les habitants, n'ayant plus d'usage de leurs cobras d'élevage, les relâchent.

Population finale de cobras à Delhi : supérieure à celle d'avant la prime.

C'est ce que l'économiste Horst Siebert appellera l'effet cobra (Der Kobra-Effekt, 2001) — la conséquence inverse d'une incitation mal conçue. Une instance de Goodhart à l'échelle d'une politique publique.

Les 5 conditions d'apparition

La loi de Goodhart ne se déclenche pas systématiquement. Elle nécessite cinq ingrédients combinés :

  1. Une mesure quantifiée (donc optimisable mathématiquement).
  2. Un acteur intelligent (humain ou IA) doté de capacité d'optimisation.
  3. Un enjeu pour cet acteur (rémunération, statut, survie, fonction objectif…).
  4. Un écart entre le proxy et la valeur réelle (toute mesure en a un).
  5. Une fenêtre temporelle suffisante pour que l'acteur apprenne le proxy.

Retirez l'un de ces 5 ingrédients → la dérive Goodhart ne se déclenche pas, ou très peu.

Cette grille vaut trois doctorats en management : avant de poser un KPI, demandez-vous lequel des 5 ingrédients vous pourriez retirer pour neutraliser Goodhart.

Trois corollaires opérationnels

Corollaire 1 — La mesure parfaitement alignée n'existe pas

Toute mesure est un proxy. Mieux vaut plusieurs proxies indépendants qu'un seul proxy « parfait ». C'est la base du triangulation principle en data science.

Corollaire 2 — Le secret retarde Goodhart

Une mesure non communiquée aux acteurs reste un bon proxy. C'est pourquoi les meilleurs designers de bonus ne révèlent jamais toute la formule de calcul.

Corollaire 3 — Plus l'optimisation est puissante, plus Goodhart frappe vite

C'est la version IA de la loi : un humain met 6 mois à apprendre à gamer un KPI. Un agent RL met 6 heures. Un LLM peut découvrir un bug d'exploitation en quelques secondes. La vitesse d'apparition de Goodhart est aujourd'hui proportionnelle à la puissance d'optimisation de l'agent — c'est ce qu'on appelle dans la communauté AI alignment le reward hacking.

Conclusion : un principe à intégrer comme une seconde nature

Goodhart n'est pas un effet pervers occasionnel. C'est une loi fondamentale des systèmes adaptatifs sous pression. Au même titre que la sélection naturelle. Et comme la sélection naturelle, elle joue toujours, partout, dès qu'il y a optimisation.

À l'ère où vous orchestrez des humains, des automatisations no-code et des LLMs sur les mêmes objectifs, Goodhart est votre risque #1. Le module suivant entre dans les mécanismes psychologiques précis qui le déclenchent chez l'humain.