"Claude écrit désormais 80 % de son propre code — l'étape d'auto-amélioration d'Anthropic arrive plus tôt que prévu"

📑 Table of Contents

D’assistant à auteur

Le changement n’est pas progressif — c’est un changement de phase. Avant l’aperçu de recherche de Claude Code en février 2025, le code généré par l’IA chez Anthropic se situait dans les faibles pourcentages à un chiffre. En mai 2026, le rapport s’est inversé : Claude est l’auteur de la grande majorité du code fusionné, tandis que les ingénieurs humains sont passés à des rôles de supervision architecturale et de révision.

« La forme des choses aujourd’hui est globalement la suivante : les humains ont des idées, et les modèles sont capables de les implémenter, de les tester et de les évaluer un ordre de grandeur plus rapidement qu’avant », a déclaré un employé d’Anthropic à VentureBeat.

Les chiffres confirment cela. Lors d’un sondage mené en mars 2026 auprès de 130 chercheurs, le répondant médian estimait avoir produit ~4× plus de résultats avec Mythos Preview qu’avec aucune assistance IA. La métrique qui capture le mieux cette transformation : un réviseur automatisé Claude a détecté ~⅓ des bugs à l’origine des incidents de production passés sur claude.ai avant qu’ils n’atteignent le déploiement.

L’accélération de 52× qui a changé la conversation

Le chiffre phare — 80 % d’auteur du code — est frappant, mais les chiffres d’accélération de la recherche sont plus révélateurs. Lorsqu’on lui a confié la tâche d’optimiser le code d’entraînement d’un petit modèle, la progression de Claude raconte l’histoire :

  • Claude Opus 4 (mai 2025) : ~3× d’accélération par rapport au code de départ
  • Claude Mythos Preview (avril 2026) : ~52× d’accélération
  • Chercheur humain qualifié : 4 à 8 heures pour atteindre 4×

« Dans cette partie du flux de travail de recherche, Claude est passé de super utile à surhumain en moins d’un an », indique le rapport.

L’horizon temporel pour le travail autonome de l’IA s’élargit à un rythme accéléré. Claude Opus 3 gérait des tâches d’environ 4 minutes en mars 2024 ; Claude Opus 4.6 gère des tâches d’environ 12 heures en mars 2026. Si la tendance se maintient — le taux de doublement est passé de tous les 7 mois à tous les 4 mois — les systèmes d’IA capables d’un travail autonome d’une semaine arriveront en 2027.

L’avertissement au cœur de la célébration

Le rapport de l’Anthropic Institute, rédigé par Marina Favaro et le cofondateur Jack Clark, est inhabituel pour une entreprise sur le point d’entrer en bourse : il est à la fois une auto-congratulation et un signal d’alarme.

Trois scénarios sont esquissés. Le pire cas : des modèles capables de concevoir et d’entraîner entièrement leurs propres successeurs, avec un progrès limité uniquement par la puissance de calcul. Dans ce monde, les humains sont réduits à des rôles de supervision tandis que l’IA auto-améliorante dépasse ses créateurs. De petits désalignements qui sont aujourd’hui gérables — Claude poursuivant occasionnellement le mauvais objectif — pourraient se cumuler sur plusieurs générations jusqu’à ce que tout contrôle significatif soit perdu.

« Nous croyons qu’il serait bon pour le monde d’avoir la possibilité de ralentir ou de suspendre temporairement le développement de l’IA de pointe », argue le rapport, tout en reconnaissant qu’aucune entreprise ne peut le faire seule. Un arrêt unilatéral « changerait qui mène sans rien accomplir de plus large ».

Scepticisme et calendrier

Le rapport a suscité un examen prévisible. Il est arrivé quelques jours après qu’Anthropic a déposé son S-1 confidentiel pour une introduction en bourse à une valorisation rapportée de 1 000 milliards de dollars. Le chiffre de 80 % est auto-déclaré et non audité. Les lignes de code sont une métrique de productivité imparfaite — le rapport lui-même concède que le chiffre de 8× « est presque certainement une surestimation du véritable gain de productivité ».

Mais rejeter l’ensemble du rapport comme un simple marketing d’introduction en bourse manque l’essentiel. Les références externes sont vérifiables de manière indépendante. SWE-bench, le test standard d’ingénierie logicielle dans le monde réel, est passé de faibles pourcentages à un seul chiffre à la saturation en deux ans. CORE-Bench, qui mesure la capacité à reproduire des recherches existantes, a saturé en 15 mois. Ce ne sont pas les chiffres d’Anthropic — ce sont ceux du domaine.

Ce que cela signifie

L’implication pratique n’est pas que « l’IA remplace les ingénieurs ». C’est que le goulot d’étranglement passe de l’écriture du code à la décision du code à écrire. L’architecture, la spécification, la révision et l’alignement deviennent les activités humaines à forte valeur ajoutée. La frappe est de plus en plus assurée par le modèle.

Pour les entreprises qui observent depuis les coulisses, la prescription en trois étapes d’Anthropic — passer à la supervision architecturale, automatiser la révision du code et cibler la dette opérationnelle à volume élevé avec des agents autonomes — devient le manuel standard. La question n’est plus de savoir s’il faut adopter des agents de codage IA, mais si l’infrastructure de révision et d’alignement de votre organisation peut suivre le rythme de leur production.

La question plus profonde, celle avec laquelle Anthropic se débat publiquement, est de savoir si quiconque le peut.


Sources : Rapport de l’Anthropic Institute « When AI Builds Itself » (4 juin 2026) ; VentureBeat ; Tom’s Hardware ; Wall Street Journal.