La ruée vers les data centers : ce que 100 milliards de dollars d'engagements dans l'infrastructure IA achètent réellement

En 2026, les chiffres qui circulent sur les dépenses en infrastructure IA frisent le ridicule. Microsoft a engagé 80 milliards de dollars pour l'exercice 2026. Les dépenses d'investissement de Google ont atteint 75 milliards de dollars sur 2025 et 2026. Amazon prévoit de dépenser plus de 100 milliards de dollars d'ici 2028. SoftBank a promis 100 milliards pour l'infrastructure IA américaine. Meta a guidé 65 milliards de dollars de dépenses d'investissement en 2025. Additionnez le tout, vous obtenez quelque chose au nord d'un demi-billion de dollars — tout cela théoriquement dirigé vers le même objectif : construire le substrat physique pour l'IA à grande échelle.
La question qui vaut la peine d'être posée n'est pas de savoir si ces chiffres sont réels. Ils le sont en grande partie. La question est de savoir ce qu'ils achètent réellement, qui capte la valeur, et si cette vague de dépenses construit un avantage permanent ou une ruée vers l'or très coûteuse qui finira par heurter un mur.
Où va réellement l'argent
La construction de data centers semble simple : de grands bâtiments, beaucoup de serveurs. La réalité est plus complexe. Le coût le plus important dans un data center IA moderne n'est pas le bâtiment — c'est le compute. Un seul GPU Nvidia H200 coûte environ 30 000 à 40 000 dollars. Un rack NVL72 abritant 72 d'entre eux coûte 3 millions de dollars ou plus. Un hyperscaler qui achète 100 000 GPUs (une estimation prudente pour un cluster d'entraînement majeur) dépense 3 à 4 milliards de dollars avant même qu'un seul serveur soit en rack.
L'architecture GB200 Blackwell de Nvidia, qui a commencé à être expédiée en volume fin 2025, a encore augmenté la prime. Un rack NVL72 Blackwell avec 72 GPUs est facturé environ 3,5 millions de dollars, et la demande a largement dépassé l'offre. Cela crée une dynamique inhabituelle : les entreprises qui dépensent le plus en infrastructure IA reversent en grande partie cet argent à un seul fournisseur. Nvidia a capturé environ 92 % des revenus des GPUs pour data centers en 2025. La ruée vers l'infrastructure, en termes financiers, est en grande partie un transfert de richesse vers Nvidia.
Sous la couche GPU, l'argent se disperse. Le réseau (Infiniband, Ethernet à 400G/800G) coûte cher. Le refroidissement — traditionnellement à eau glacée (CHWS) et de plus en plus le refroidissement liquide direct (DLC) pour les racks GPU haute densité — ajoute 1 à 3 millions de dollars par mégawatt de capacité. Les bâtiments eux-mêmes, sur les marchés de premier rang (nord de la Virginie, Phoenix, Chicago), font l'objet d'enchères, avec des délais de construction de 18 à 36 mois. Et puis il y a l'électricité.
L'électricité est le vrai goulot d'étranglement
Un data center de 100 mégawatts — une taille significative mais pas exceptionnelle pour un cluster IA — a besoin environ de la production d'une petite centrale électrique fonctionnant en continu. À 1 gigawatt, l'échelle que les hyperscalers visent désormais pour un seul campus, il faut l'équivalent du barrage Hoover rien que pour cette installation. Les réseaux électriques ne sont pas conçus pour ce genre de changement brutal de la demande.
L'ordonnance de juin 2026 de la FERC (Federal Energy Regulatory Commission) obligeant les opérateurs de réseau à accélérer le raccordement des grosses charges (les « show cause » orders de la FERC aux six opérateurs régionaux) est une réponse directe aux hyperscalers qui se heurtent aux plafonds de capacité électrique. Dans PJM — le réseau qui couvre la majeure partie de la côte Est et du Midwest américain — il y a un arriéré de 400 gigawatts de demandes de raccordement. Un data center qui qualifie son site aujourd'hui pourrait attendre quatre à six ans pour un branchement fiable au réseau.
Les hyperscalers s'adaptent en se co-implantant directement avec des sources de production. Microsoft a signé des accords avec Constellation Energy et d'autres opérateurs nucléaires pour redémarrer ou licencier des capacités nucléaires existantes. Google a contracté avec Kairos Power pour des petits réacteurs modulaires (SMRs). Amazon a acquis le campus de data center de Talen Energy adjacent à une centrale nucléaire de 2,5 GW en Pennsylvanie. Le schéma est clair : la prochaine phase de l'infrastructure IA est aussi un déploiement d'infrastructure énergétique, avec des data centers en compétition avec les villes pour une capacité réseau rare.
Nouveaux entrants et pourquoi l'hyperscale n'est plus réservée aux hyperscalers
Les besoins en capital de l'infrastructure IA ont créé une ouverture inhabituelle pour les acheteurs financiers. CoreWeave, soutenu par des fonds propres et financements de Nvidia, a atteint une valorisation de 23 milliards de dollars d'ici 2025 et est entré en bourse début 2026, devenant l'une des entreprises d'infrastructure à la croissance la plus rapide de l'histoire. Son modèle — acheter des GPUs en volume, les louer aux développeurs IA qui ont besoin de capacité en rafale — fonctionne précisément parce que les hyperscalers ont alloué la majeure partie de leur propre capacité GPU à des charges de travail internes.
Adam Selipsky, l'ancien PDG d'AWS, a lancé Helix Digital Infrastructure en juin 2026 avec 10 milliards de dollars de capital engagé de KKR, un partenariat avec Nvidia, et le fonds souverain du Koweït comme investisseur principal. Le pitch est l'intégration verticale : data centers, production d'électricité, transport et fibre sous un même toit. Crusoe Energy a construit un modèle intégré similaire en partant du torchage de gaz naturel sur les champs pétroliers. La thèse dans tous ces cas est que posséder la pile complète — compute, électricité, connectivité — produit des marges qui ne peuvent pas être concurrencées.
Qui capte réellement la valeur
Dans tout déploiement d'infrastructure, les fournisseurs de ce déploiement s'en sortent souvent mieux que les bâtisseurs eux-mêmes. L'ère ferroviaire a enrichi les compagnies sidérurgiques, pas seulement les opérateurs de chemins de fer. Le déploiement d'Internet a enrichi Cisco et les câblo-opérateurs. La vague d'infrastructure IA suit un schéma similaire :
Nvidia capte la valeur la plus directe, avec des marges brutes de plus de 70 % sur ses produits pour data centers. L'arriéré de demande s'étend bien au-delà de 2027. Le MI300X d'AMD a fait des percées, et les TPUs de Google sont compétitifs en interne, mais l'écosystème CUDA de Nvidia crée des coûts de changement que les fournisseurs de GPUs commodités ont du mal à surmonter.
Les utilities électriques comme Constellation, Vistra et NRG Energy ont vu leurs cours boursiers à peu près doubler sur 2024-2025, le signal de demande IA ayant atteint les marchés de l'électricité. Les opérateurs nucléaires en particulier en bénéficient, car le nucléaire fournit la base toujours active (baseload) dont les charges de travail d'entraînement IA ont besoin.
Les REITs de data centers comme Equinix et Digital Realty profitent de la demande de colocation, même si les hyperscalers construisant leurs propres installations limitent la part que les REITs captent des déploiements IA internes.
La capture de valeur la moins certaine revient aux hyperscalers eux-mêmes. La question de savoir si 500 milliards de dollars de dépenses d'infrastructure génèrent des revenus d'applications IA proportionnels n'est pas réglée. L'analogie avec l'ère du cloud est encourageante — AWS, Azure et GCP combinés génèrent plus de 400 milliards de dollars de revenus annualisés — mais la couche applicative IA est plus précoce et moins certaine. Les hyperscalers parient que les contraintes de capacité d'aujourd'hui deviennent des fossés concurrentiels demain.
Ce que cela signifie concrètement
Pour les développeurs et les startups, la ruée vers l'infrastructure a un effet paradoxal : elle devrait rendre le compute moins cher à long terme (plus de capacité, plus de concurrence) mais plus cher à court terme (demande excédentaire, prix spot élevés). Les entreprises qui ont verrouillé des contrats d'accès GPU engagés en 2024-2025 ont un avantage significatif. Celles qui entrent sur le marché maintenant paient des tarifs spot élevés ou rejoignent de longues listes d'attente.
Pour les entreprises qui évaluent leur stratégie d'infrastructure IA, l'idée clé est que la question construire vs acheter est de plus en plus une question de délai et de caractéristiques de charge de travail. L'inférence généraliste et l'expérimentation appartiennent aux APIs cloud managées. L'entraînement de grands modèles propriétaires, l'inférence persistante à haut débit à grande échelle, ou l'exploitation dans des environnements très réglementés (où les données ne peuvent pas quitter votre contrôle) justifient une infrastructure possédée ou dédiée — mais en sachant que l'accès à l'électricité est désormais une contrainte de sélection de site aussi importante que la connectivité réseau l'était dans les années 2000.
La ruée ne durera pas éternellement. Une fois que les arriérés d'électricité et de construction se seront résorbés — probablement 2027-2028 — la disponibilité de capacité GPU se normalisera. Les entreprises qui sécurisent l'accès à l'électricité, les relations avec les fournisseurs de puces et un historique d'exploitation à grande échelle pendant la période contrainte auront un avantage structurel. Les autres pourront louer ce dont elles ont besoin. De quel côté de cette ligne une entreprise se retrouve pourrait être déterminé par les décisions prises dans les 18 prochains mois.