“Anthropic accuse Alibaba de la plus grande attaque par distillation connue sur Claude”

Anthropic a officiellement accusé le géant chinois du commerce électronique et de l’IA Alibaba d’avoir orchestré ce qu’elle qualifie de « plus grande attaque par distillation connue contre Anthropic à ce jour » — une campagne systématique visant à extraire les capacités de ses modèles de pointe Claude via près de 25 000 comptes frauduleux.

Dans une lettre adressée à la commission bancaire du Sénat américain le 10 juin et obtenue par Reuters, Bloomberg et le Wall Street Journal, Anthropic a détaillé une opération qu’elle attribue à des opérateurs affiliés au laboratoire d’IA Qwen d’Alibaba, menée entre le 22 avril et le 5 juin 2026. La campagne a généré environ 28,8 millions d’échanges avec Claude — exploitant essentiellement les sorties du modèle à une échelle industrielle.

Extraction à l’échelle industrielle

La distillation de modèles — qui consiste à entraîner un modèle plus petit en lui faisant apprendre d’un modèle plus grand et plus performant — est une technique légitime lorsqu’elle est appliquée à ses propres modèles. Ce qu’Anthropic décrit est différent : utiliser des comptes factices pour échantillonner systématiquement les sorties d’un modèle de pointe concurrent, sur un nombre suffisant de types de tâches pour constituer un jeu de données de couverture, sans aucune licence ni divulgation publique.

« Ces attaques par distillation sont menées illicitement, systématiquement et à une échelle industrielle pour récolter les capacités d’IA américaines des laboratoires de pointe et les réemballer comme leurs propres créations », a écrit Anthropic dans la lettre, « sans supporter les coûts de formation et de R&D nécessaires pour entraîner les modèles de pointe américains. »

Contexte : le paysage post-Mythos

Cette accusation intervient à un moment particulièrement tendu. Quelques semaines plus tôt, l’administration Trump avait ordonné à Anthropic de suspendre l’accès à ses modèles les plus avancés — Claude Fable 5 et le Claude Mythos 5 sur invitation — pour les utilisateurs en dehors des États-Unis, invoquant des préoccupations de sécurité nationale et de contrôle des exportations. L’opération d’Alibaba se serait déroulée précisément pendant cette période, et la lettre d’Anthropic la présente comme un défi direct aux contrôles américains sur les exportations d’IA de pointe.

Implications plus larges

Cette attaque met en lumière une asymétrie fondamentale dans la sécurité des IA de pointe. Chaque conversation que Claude a avec un utilisateur légitime est identique à une conversation avec un attaquant qui extrait ses capacités. Anthropic indique avoir détecté les comptes frauduleux grâce à des schémas comportementaux et des anomalies d’échelle, mais cet épisode soulève des questions dérangeantes sur la manière dont les laboratoires peuvent protéger leurs modèles les plus avancés lorsque la surface d’extraction est effectivement chaque point d’accès API.

Alibaba n’a pas encore répondu publiquement à ces allégations. Ses actions étaient en baisse d’environ 31 % depuis le début de l’année au moment où l’histoire a éclaté le 24 juin. De son côté, Anthropic a publié un article technique d’accompagnement — « Détection et prévention des attaques par distillation » — détaillant ses contre-mesures, notamment la vérification des comptes, l’analyse des schémas d’utilisation et les techniques de tatouage.

Cette affaire devrait intensifier le débat politique en cours sur les contrôles des exportations d’IA, et ne sera presque certainement pas la dernière bataille de distillation entre les laboratoires d’IA américains et chinois.