“Google paie 920 M$/mois à SpaceX pour des GPU NVIDIA — la course à l’infrastructure IA s’intensifie”

L’accord : 920 millions de dollars par mois pour 110 000 GPU

Le 5 juin 2026, SpaceX a divulgué dans un dépôt réglementaire auprès de la SEC que Google avait signé un accord de services cloud lui donnant accès à « environ 110 000 GPU NVIDIA, CPU, mémoire et autres composants associés ». Le prix : 920 millions de dollars par mois d’octobre 2026 à juin 2029, chaque partie pouvant résilier le contrat après le 31 décembre 2026 moyennant un préavis de 90 jours.

Avec un engagement total d’environ 30 milliards de dollars, cet accord rivalise avec le PIB de plusieurs petits pays. Il intervient une semaine seulement après qu’Anthropic a annoncé qu’elle paierait à SpaceX 1,25 milliard de dollars par mois jusqu’en 2029 pour « la totalité de la capacité de calcul » du centre de données Colossus 1 — la même installation de Memphis initialement construite par xAI, qui a fusionné avec SpaceX en février 2026 dans le cadre d’une transaction valorisant l’entité combinée à 1 250 milliards de dollars, selon CNBC.

Entre les contrats de Google et d’Anthropic, SpaceX perçoit désormais plus de 2,1 milliards de dollars par mois de revenus liés au calcul IA — provenant de deux de ses plus grands concurrents dans la course à l’IA. Cela représente plus de 25 milliards de dollars par an en loyer pour du matériel initialement construit pour entraîner Grok.

Pourquoi Google — de toutes les entreprises — a besoin de la puissance de calcul de SpaceX

Ce qui est intéressant ici, ce n’est pas le prix. C’est qui paie.

Google a inventé le TPU. Il exploite l’une des trois plus grandes plateformes cloud au monde. Sa société mère, Alphabet, a annoncé des projets début juin pour lever 85 milliards de dollars en actions — dont un investissement de 10 milliards de dollars de Berkshire Hathaway — explicitement pour financer l’infrastructure IA. Et pourtant, Google a encore besoin de louer des GPU à une entreprise de fusées.

Un porte-parole de Google Cloud a déclaré au New York Times que cet accord est « un accord à court terme et opportun pour nous assurer une capacité de transition afin de répondre à la demande croissante de nos clients pour notre plateforme d’agents, Gemini Enterprise, qui a été encore plus élevée que prévu ».

Le mot-clé est « capacité de transition ». Le propre déploiement des centres de données de Google — qui se déroule déjà à un rythme qui verra Alphabet dépenser environ 200 milliards de dollars en dépenses d’investissement en 2026, selon CNBC — ne peut pas suivre le rythme de la demande pour sa plateforme d’IA agentique. La société a divulgué en avril que son activité cloud avait des contrats totalisant 460 milliards de dollars de revenus non réalisés en attente, ce qui indique une demande qui dépasse de loin la capacité actuelle.

C’est l’équivalent, en matière d’infrastructure, d’Amazon louant un espace d’entrepôt à Walmart pendant la ruée des fêtes. Cela ne devrait pas arriver — et le fait que cela arrive vous dit tout sur l’ampleur de la pénurie de capacité de calcul IA.

Le schéma historique : les fournisseurs de cloud comme faiseurs de rois de l’IA

Google louant à SpaceX n’est pas une anomalie. C’est le dernier chapitre d’un schéma qui dure depuis plusieurs années, où les fournisseurs de cloud deviennent la couche d’infrastructure indispensable pour le développement de l’IA — et en tirent des rentes énormes :

Microsoft + OpenAI (2019–présent) : L’investissement de plusieurs milliards de dollars de Microsoft dans OpenAI a été structuré principalement sous forme de crédits de calcul Azure. OpenAI exécute son entraînement et son inférence sur l’infrastructure Microsoft, faisant d’Azure le fournisseur de cloud exclusif pour ChatGPT et les familles de modèles GPT. En retour, Microsoft reçoit une part des bénéfices d’OpenAI et une intégration profonde dans des produits comme Copilot.
Anthropic + Google Cloud (2023–présent) : Google a investi plus de 2 milliards de dollars dans Anthropic, dont une partie importante a été structurée sous forme de crédits de calcul Google Cloud. Anthropic exécute Claude sur les TPU et GPU de Google, faisant de Google l’épine dorsale de l’infrastructure pour l’un des trois principaux laboratoires de pointe.
AWS + Anthropic (2023–présent) : Amazon a investi 4 milliards de dollars dans Anthropic, faisant d’AWS le « fournisseur de cloud principal d’Anthropic pour les charges de travail critiques ». L’accord donne à AWS accès aux modèles d’Anthropic pour Bedrock, le service d’IA géré d’Amazon.
Anthropic + SpaceX (mai 2026) : Anthropic a brisé le moule en louant directement auprès d’un fournisseur non-cloud. L’accord Colossus à 1,25 milliard de dollars par mois contourne complètement l’intermédiaire hyperscaler — bien que les origines xAI de SpaceX fassent de cet arrangement davantage un cas de concurrent louant à un concurrent qu’une véritable initiative indépendante.
Google + SpaceX (juin 2026) : Maintenant, Google lui-même — un hyperscaler — loue au même fournisseur non-cloud. La boucle est bouclée.

Le fil conducteur est difficile à manquer : les laboratoires d’IA ont besoin de capacité de calcul. Les fournisseurs de cloud en ont. Et maintenant, lorsque les fournisseurs de cloud sont à court, ils deviennent eux aussi des locataires. Le « cloud » dans « cloud IA » est de plus en plus simplement « celui qui a des GPU branchés ».

Ce que cela signifie pour l’économie des agents IA

Pour quiconque construit ou déploie des agents IA, les accords avec SpaceX devraient faire sonner l’alarme.

Les agents IA sont fondamentalement différents des chatbots. Une seule tâche agentique — par exemple, déboguer une base de code, analyser un document juridique ou orchestrer un flux de travail en plusieurs étapes — peut consommer des centaines de milliers de tokens. Là où une requête ChatGPT peut utiliser 500 à 2 000 tokens, une tâche d’agent brûle régulièrement 50 000 à 500 000 tokens ou plus, à mesure que le modèle raisonne, appelle des outils, traite les résultats et itère.

Aux prix actuels de l’inférence — même avec la réduction de coût d’un facteur 1 000 que l’industrie a réalisée au cours des trois dernières années, selon l’analyse de GPU Nexus — les charges de travail des agents sont coûteuses. Une seule tâche d’agent complexe peut coûter entre 0,50 $ et 5,00 $ en inférence brute. Multipliez cela par des milliers d’utilisateurs, des centaines de tâches par jour, et les chiffres deviennent vertigineux.

Considérez maintenant ce qui se passe lorsque la capacité GPU elle-même devient le goulot d’étranglement. Si même Google — avec sa flotte de TPU et son budget d’investissement de 200 milliards de dollars — ne peut pas construire suffisamment de capacité, quelles sont les chances pour une entreprise de taille moyenne ou un projet open-source ?

La réponse est : ils deviennent preneurs de prix. Lorsque la capacité de calcul est rare, les prix augmentent. Lorsque les prix augmentent, l’économie des agents se brise. L’enthousiasme actuel autour des agents IA autonomes remplaçant les flux de travail humains suppose un monde d’inférence abondante et bon marché. Les accords avec SpaceX suggèrent que ce monde pourrait être plus éloigné que l’industrie ne l’espérait.

Le problème du verrouillage open-source

Il y a un effet de second ordre encore plus préoccupant pour l’écosystème des agents IA open-source.

Lorsque les coûts de calcul sont élevés, l’avantage économique des modèles open-source s’érode. Un modèle open-source peut être gratuit à télécharger, mais si exécuter l’inférence dessus coûte 2 $ par million de tokens sur des GPU loués, tandis qu’une API propriétaire facture 1,50 $ par million de tokens et gère toute l’infrastructure, le modèle « gratuit » n’est pas moins cher — il est plus cher.

Cela crée un avantage structurel pour les acteurs verticalement intégrés. Les entreprises qui contrôlent à la fois le modèle et l’infrastructure (Google avec Gemini + TPU, Microsoft/OpenAI avec Azure, Amazon avec Bedrock + AWS) peuvent subventionner les coûts d’inférence d’une manière que les développeurs indépendants ne peuvent pas. Les accords avec SpaceX montrent que même Google paie désormais les tarifs du marché pour du calcul externe — ce qui signifie que même l’économie interne de Google est sous pression.

Pour la communauté des agents open-source, les implications sont claires. Des projets comme OpenClaw, Hermes Agent et des dizaines de frameworks d’agents open-source dépendent d’une inférence abordable. Si la capacité GPU se consolide en une poignée de méga-accords entre hyperscalers et fournisseurs d’infrastructure, la longue traîne des développeurs indépendants sera évincée — non pas par des fossés logiciels, mais par l’économie du matériel.

La vue d’ensemble : 750 milliards de dollars et plus

Les accords avec SpaceX n’existent pas en vase clos. Ils font partie d’une frénésie de dépenses en infrastructure IA sans précédent historique.

Les dépenses d’investissement combinées des géants de la tech pour 2026 devraient dépasser 750 milliards de dollars, selon la recherche de Goldman Sachs et l’analyse du Futurum Group. Voici comment se positionnent les principaux acteurs :

Amazon : ~200 milliards de dollars de dépenses d’investissement en 2026, largement tirées par l’infrastructure IA d’AWS. Les analystes de Morgan Stanley prévoient un flux de trésorerie disponible négatif allant jusqu’à 28 milliards de dollars en conséquence.
Alphabet (Google) : ~200 milliards de dollars en 2026, avec Brian Nowak de Morgan Stanley prévoyant jusqu’à 250 milliards de dollars d’ici 2027. La société vient de lever 85 milliards de dollars lors d’une vente d’actions pour financer le déploiement.
Microsoft : ~130 milliards de dollars, largement destinés à la capacité IA d’Azure soutenant les charges de travail d’OpenAI et Copilot.
Meta : Jusqu’à 135 milliards de dollars, les analystes de Barclays prévoyant une baisse de près de 90 % du flux de trésorerie disponible en raison de ces dépenses.

Goldman Sachs prévoit que les dépenses d’investissement cumulées en IA des géants de la tech pourraient atteindre 5 300 milliards de dollars d’ici 2030 — dépassant le PIB du Japon, de l’Inde, du Royaume-Uni ou de la France individuellement.

Rien qu’au premier trimestre 2026, les quatre principaux hyperscalers ont dépensé plus de 130 milliards de dollars en dépenses d’investissement, selon le New York Times. Cela représente environ 1,4 milliard de dollars par jour en infrastructure IA.

La suite

Les accords avec SpaceX marquent un tournant dans l’histoire de l’infrastructure IA, sous l’effet de plusieurs pressions convergentes.

Le modèle hyperscaler est sous tension. Lorsque Google — l’entreprise qui conçoit ses propres puces IA — a besoin de louer des GPU à un fournisseur externe, la stratégie du « tout construire nous-mêmes » a atteint ses limites. Attendez-vous à davantage d’accords de calcul multi-cloud et avec des tiers, car la demande continue de dépasser la capacité interne.

Le calcul devient également un actif géopolitique. Les centres de données Colossus sont situés à Memphis, dans le Tennessee — pas dans un pôle technologique côtier. L’emplacement physique de l’infrastructure IA est de plus en plus lié à la disponibilité énergétique, aux environnements réglementaires et aux considérations de sécurité nationale. La récente annonce par SpaceX d’une « gigantesque usine de puces » au Texas, selon le NYT, renforce cette tendance.

Et puis il y a le problème de l’économie des agents. La révolution des agents IA n’attend pas de meilleurs modèles — elle attend une inférence moins chère. Comme l’a écrit en janvier 2026 David Patterson, l’ingénieur de Google lauréat du prix Turing et co-concepteur du TPU : « L’inférence des LLM est une crise. » Les accords avec SpaceX prouvent qu’il a raison, et ils suggèrent que la crise s’aggrave avant de se résoudre.

Pour l’écosystème des agents, le message est clair : le logiciel est prêt. Le matériel ne l’est pas. Et l’écart entre les deux est comblé par des accords de plusieurs milliards de dollars qui redéfinissent qui a accès à l’IA — et à quel prix.

FAQ

Google abandonne-t-il sa stratégie TPU ?

Non. L’accord avec SpaceX est explicitement décrit comme une « capacité de transition » — du calcul loué temporairement pour combler le fossé pendant que le propre déploiement d’infrastructure de Google rattrape son retard. Alphabet dépense environ 200 milliards de dollars en dépenses d’investissement en 2026, dont une grande partie pour des centres de données équipés de TPU. Mais avec 460 milliards de dollars de revenus cloud non réalisés en attente, la capacité interne seule ne peut pas suivre le rythme.

Cela rendra-t-il les agents IA plus chers ?

À court terme, probablement. Lorsque même Google paie les tarifs du marché pour les GPU, les jours de l’inférence fortement subventionnée sont comptés. Mais la pression devrait s’atténuer à mesure que davantage de capacité sera mise en ligne — les puces Rubin de nouvelle génération de Nvidia, les TPU v6 de Google et l’expansion de Colossus indiquent tous que l’offre rattrapera la demande d’ici fin 2027 ou début 2028. La question est de savoir si l’écosystème des agents peut survivre à la pression entre-temps.

Comment cela se compare-t-il à l’accord Anthropic-SpaceX ?

L’accord d’Anthropic est plus important : 1,25 milliard de dollars par mois contre 920 millions de dollars par mois pour Google. Mais la différence stratégique importe davantage. Anthropic est un laboratoire d’IA pur sans infrastructure cloud propre — louer à SpaceX était une décision logique. Google louant à SpaceX, c’est un hyperscaler admettant qu’il ne peut pas construire assez vite. C’est le titre.

Qu’est-ce que cela signifie pour les petites startups d’agents IA ?

Difficile à court terme, meilleur à long terme. Les startups qui dépendent de l’inférence sur GPU loué seront confrontées à une pression sur leurs marges à mesure que les coûts de calcul augmentent. Mais le déploiement d’infrastructure que ces accords représentent — 750 milliards de dollars rien qu’en 2026 — signifie que davantage de capacité totale finira par être mise en ligne. Les gagnantes seront les startups qui conçoivent leurs architectures d’agents pour minimiser l’utilisation de tokens et maximiser l’efficacité de l’inférence, plutôt que de traiter le calcul comme une ressource illimitée.

Pour aller plus loin

Dépôt SEC de SpaceX — La divulgation réglementaire officielle de l’accord de services cloud Google-SpaceX (5 juin 2026)
TechCrunch — Google paiera 920 millions de dollars par mois à SpaceX pour du calcul — Couverture de l’accord avec analyse financière
New York Times — SpaceX fournira de la puissance de calcul à Google — Reportage détaillé incluant le cadrage de « capacité de transition » de Google
CNBC — Google paiera 920 millions de dollars par mois à SpaceX — Contexte financier avec commentaires d’analystes
WSJ — Google paiera près d’un milliard de dollars par mois à SpaceX — L’accord sous un angle commercial/concurrentiel
CNBC — Les 750 milliards de dollars de dépenses d’investissement en IA des géants de la tech — Projections de Goldman Sachs pour les dépenses d’infrastructure des hyperscalers
Futurum Group — Dépenses d’investissement en IA 2026 : le sprint d’infrastructure à 690 milliards de dollars — Analyse indépendante du déploiement de l’infrastructure IA
GPU Nexus — Économie de l’inférence IA en 2026 — Analyse des coûts d’inférence et de la réduction d’un facteur 1 000 sur trois ans
arXiv:2601.05047 — David Patterson sur la crise de l’inférence des LLM — L’analyse technique du lauréat du prix Turing sur les goulots d’étranglement de l’inférence