Anthropic a discrètement déployé l’une de ses mises à jour de plateforme les plus importantes pour les développeurs. Au cours des dernières semaines, une série de nouvelles fonctionnalités d’infrastructure pour agents est passée des aperçus de recherche à la bêta publique : Programmatic Tool Calling, la Stratégie Advisor, Tool Search, la Files API et le MCP Connector. Combinées à la fenêtre de contexte de 1 million de tokens désormais disponible sur Claude Sonnet 4, ces capacités transforment fondamentalement la manière dont les développeurs construisent des agents propulsés par Claude.
Il ne s’agit pas d’une simple mise à jour mineure. C’est un nouveau paradigme architectural pour l’utilisation d’outils à grande échelle.
La crise du gonflement du contexte — et comment Anthropic l’a résolue
Tout développeur ayant construit un agent sérieux avec appel d’outils connaît cette douleur. Connectez cinq serveurs MCP — Jira, GitHub, Google Drive, Slack et une base de données — et vous vous retrouvez avec 50 000 tokens ou plus de définitions d’outils avant même que le premier message utilisateur réel ne soit traité. Avec un contexte de 200K, il ne reste qu’environ 150K pour le travail réel. Avec le contexte par défaut de 1M d’Opus 4.8, le problème est moins aigu, mais le coût de ce gonflement persiste : chaque token coûte, et chaque résultat d’outil renvoyé dans le contexte rend la tâche du modèle plus difficile.
La solution d’Anthropic est une attaque en trois volets contre la pollution du contexte.
1. Tool Search — Chargement différé pour les bibliothèques d’outils massives
Le Tool Search Tool vous permet de marquer la grande majorité de vos outils avec defer_loading: true. Seul un outil de recherche léger (~500 tokens) est chargé initialement. Les outils sont découverts à la demande via regex, BM25 ou recherche personnalisée.
Les chiffres sont frappants :
| Approche | Tokens consommés avant le travail | Contexte préservé |
|---|---|---|
| Traditionnelle (tous les outils upfront) | ~77K tokens | ~23K (pour une fenêtre de 100K) |
| Tool Search Tool | ~8,7K tokens | ~91K (95% préservé) |
Sur les évaluations MCP internes d’Anthropic, la précision est passée de 49% à 74% pour Opus 4, et de 79,5% à 88,1% pour Opus 4.5. Pour les agents avec 10 outils ou plus, ou plusieurs serveurs MCP, il s’agit d’une infrastructure essentielle.
2. Programmatic Tool Calling — Orchestration dans le bac à sable
Le Programmatic Tool Calling (PTC) est sans doute la plus innovante des nouvelles fonctionnalités. Au lieu que Claude demande des outils un par un via des allers-retours API (chacun nécessitant un passage complet du modèle), Claude écrit du code d’orchestration Python qui appelle vos outils depuis un bac à sable d’exécution de code.
Un exemple concret tiré de la documentation d’Anthropic illustre la puissance de cette approche :
Vérifier la conformité budgétaire de 20 employés nécessite traditionnellement 20 allers-retours modèle distincts et extrait des milliers de lignes de dépenses dans le contexte. Avec PTC, un seul script exécute les 20 recherches en parallèle, filtre les résultats et ne retourne que les quatre employés qui ont dépassé leurs limites — réduisant ce que Claude doit analyser de centaines de kilo-octets à une poignée de lignes.
Gains d’efficacité selon les benchmarks internes :
| Métrique | Sans PTC | Avec PTC |
|---|---|---|
| Tokens moyens consommés | 43 588 | 27 297 (-37%) |
| Récupération de connaissances internes | 25,6% | 28,5% |
| Benchmarks d’agent intelligent général (GIA) | 46,5% | 51,2% |
PTC est particulièrement transformateur pour trois cas d’usage :
- Agrégation de grandes données : filtrer/agréger des milliards de lignes avant que Claude ne les voie
- Workflows dépendants multi-étapes : appeler des outils en boucle, avec des branchements conditionnels
- Opérations parallèles : déployer 50 appels API simultanément
Cette fonctionnalité nécessite l’outil code_execution et est disponible sur tous les modèles Opus 4.5+ et Sonnet 4.5+.
3. Stratégie Advisor — Intelligence bi-modèle sans la taxe d’orchestration
L’Advisor Tool implémente un modèle que les architectes d’agents attendaient depuis des années : associer un modèle exécuteur rapide et économique (Sonnet 4.6 ou Haiku 4.5) à un modèle conseiller à haute intelligence (Opus 4.8) — le tout en un seul appel API.
Lorsque l’exécuteur rencontre un point de décision complexe, il émet un bloc server_tool_use. Le serveur exécute de manière transparente un passage d’inférence séparé sur le modèle conseiller, en lui transmettant la transcription complète de la conversation. Le conseiller produit un plan (généralement 400 à 700 tokens de texte avec environ 1 400 tokens au total, réflexion comprise), et l’exécuteur continue, éclairé par ce conseil.
Flux architectural :
Exécuteur (Sonnet 4.6) → rencontre une décision complexe
→ émet un signal d'outil conseiller
→ Le serveur exécute Opus 4.8 sur la transcription complète
→ Le conseiller retourne un plan (400-700 tokens)
→ L'exécuteur continue avec le conseil
Le résultat : une qualité proche d’Opus sur les décisions difficiles, tandis que l’essentiel de la génération se fait aux tarifs de Sonnet. Le modèle conseiller est facturé séparément à son propre tarif, mais comme il n’est sollicité que sur les tours difficiles, le coût total est souvent inférieur à celui d’Opus utilisé comme exécuteur de bout en bout.
Paires exécuteur + conseiller prises en charge :
| Exécuteur | Conseillers disponibles |
|---|---|
| Haiku 4.5 | Opus 4.7, Opus 4.8 |
| Sonnet 4.6 | Opus 4.7, Opus 4.8 |
| Opus 4.6 | Opus 4.7, Opus 4.8 |
| Opus 4.7 | Opus 4.8 |
| Opus 4.8 | Opus 4.8 |
Files API et MCP Connector — Étendre la portée
Deux fonctionnalités supplémentaires complètent cette mise à jour de la plateforme :
La Files API (bêta publique) vous permet de télécharger des fichiers et de les référencer dans la Messages API et l’outil d’exécution de code. Au lieu d’encoder en base64 de grands documents dans les messages, vous téléchargez une fois et référencez par ID. Il s’agit d’une amélioration significative de la qualité de vie pour les workflows lourds en documents.
Le MCP Connector (bêta publique) permet de se connecter à des serveurs MCP distants directement depuis la Messages API — sans nécessiter de client ou proxy MCP séparé. Combiné à Tool Search, il devient pratique d’offrir aux agents un accès à des dizaines de services externes sans exploser les limites de tokens.
Fenêtre de contexte de 1M — Maintenant sur Sonnet 4
Anthropic a également rendu la fenêtre de contexte de 1 million de tokens disponible en bêta pour Claude Sonnet 4, à la fois sur l’API et sur Amazon Bedrock. Alors qu’Opus 4.8 utilise déjà 1M par défaut, son arrivée sur le niveau Sonnet signifie que les développeurs soucieux des coûts peuvent désormais traiter des bases de code entières, des documents de la taille d’un livre ou des historiques de conversations de plusieurs heures sans se ruiner.
Ce que cela signifie pour les développeurs d’agents
Prises ensemble, ces fonctionnalités représentent une vision de plateforme cohérente :
- Le contexte coûte cher — différé-le, filtre-le et garde-le hors du modèle jusqu’à ce qu’il soit nécessaire (Tool Search, PTC)
- L’intelligence coûte cher — utilise un exécuteur économique par défaut ; fais appel à l’artillerie lourde uniquement lorsque le problème l’exige (Stratégie Advisor)
- L’intégration ne devrait pas coûter cher — connecte-toi à n’importe quel serveur MCP directement depuis l’API ; référence les fichiers sans acrobaties d’encodage (MCP Connector, Files API)
Pour les développeurs qui construisent des agents de production, la voie est claire. L’ère où l’on fourrait chaque définition d’outil dans un seul appel modèle en espérant le meilleur est révolue. Anthropic a construit l’infrastructure pour une architecture d’agent chirurgicale, économique et efficace en termes de contexte — et tout est disponible en bêta publique dès aujourd’hui.
Pour commencer
Toutes les fonctionnalités sont disponibles sur la Claude API et la plateforme Claude sur AWS. Programmatic Tool Calling et l’Advisor Tool nécessitent des en-têtes bêta (code_execution_20260120 et advisor-tool-2026-03-01 respectivement). La Files API, le MCP Connector et Tool Search sont également en bêta publique.
Comme toujours, consultez la documentation de la Claude API pour la dernière matrice de compatibilité, les tarifs et les guides de migration.