AIO APEX

L'IA épuise le réseau : au cœur de la crise énergétique des data centers qui redessine les infrastructures électriques

Partager:
L'IA épuise le réseau : au cœur de la crise énergétique des data centers qui redessine les infrastructures électriques

Les chiffres ne mentent pas

En 2023, les data centers ont consommé environ 460 térawattheures (TWh) d'électricité dans le monde — soit près de 2 % de la demande mondiale totale d'électricité. D'ici 2026, l'Agence internationale de l'énergie prévoit que ce chiffre doublera pour atteindre plus de 1000 TWh par an, porté presque entièrement par les charges de travail d'entraînement et d'inférence de l'IA. Pour mettre cela en perspective : 1000 TWh représentent plus d'électricité que la totalité de la consommation annuelle de l'Allemagne.

Une seule session d'entraînement d'IA à grande échelle — comme celles utilisées pour développer des modèles de frontière — peut consommer 50 à 100 gigawattheures (GWh) d'électricité. L'entraînement de GPT-4 est estimé avoir utilisé environ 50 GWh. L'inférence, le processus d'exécution d'un modèle entraîné pour répondre aux requêtes, monte en charge encore plus vite : avec des millions d'utilisateurs actifs quotidiens par grand produit d'IA, la demande d'inférence dépasse désormais la demande d'entraînement en consommation totale d'énergie dans de nombreuses installations Hyperscaler.

Le réseau est déjà sous pression

PJM Interconnection, le plus grand opérateur de réseau électrique d'Amérique du Nord couvrant 13 États et Washington D.C., a averti en 2024 que la demande prévue d'électricité pour la prochaine décennie avait bondi de 40 % par rapport à ses prévisions de 2022 — en grande partie à cause des data centers. En Virginie du Nord, qui abrite la concentration la plus dense de data centers au monde (« Data Center Alley »), les fournisseurs d'énergie locaux ont imposé des moratoires de capacité dans certaines sous-stations parce que le réseau ne peut tout simplement pas fournir plus d'électricité sans des années de mises à niveau des infrastructures.

L'Irlande, qui héberge les data centers européens de Google, Meta, Amazon et Microsoft, a vu les data centers consommer 21 % de toute l'électricité nationale en 2023. L'opérateur du réseau irlandais EirGrid a commencé à restreindre les nouvelles connexions de data centers dans la région de Dublin jusqu'à au moins 2028. Singapour a imposé un moratoire de trois ans sur la construction de nouveaux data centers de 2019 à 2022 pour des raisons identiques, ne le levant qu'après avoir obtenu des engagements en matière d'énergie verte.

Le goulot d'étranglement n'est pas seulement la production — c'est la capacité de transport et des sous-stations. La construction d'une nouvelle sous-station haute tension prend 4 à 7 ans aux États-Unis en raison des permis, des contraintes de chaîne d'approvisionnement pour les gros transformateurs de puissance et de la coordination avec les fournisseurs d'énergie. L'infrastructure d'IA est déployée en quelques mois. L'écart entre les délais de demande et les délais de mise à niveau du réseau est le point de tension central de cette crise.

Partenariats avec les fournisseurs d'énergie : un nouveau modèle industriel

Face aux contraintes du réseau, les Hyperscalers contournent l'approvisionnement traditionnel auprès des fournisseurs d'énergie et négocient directement avec les producteurs d'électricité. Microsoft a signé un accord d'achat d'électricité à long terme (PPA) de 20 ans avec Constellation Energy en 2023 pour redémarrer l'unité 1 de la centrale nucléaire de Three Mile Island, qui avait été fermée en 2019 pour des raisons économiques. L'accord est estimé à plus de 3 milliards de dollars et fournira environ 835 mégawatts (MW) d'électricité de base sans carbone exclusivement pour les data centers de Microsoft.

Amazon a adopté une approche différente, en acquérant un campus de data center directement situé à côté de la centrale nucléaire de Susquehanna en Pennsylvanie, obtenant une alimentation dédiée de 960 MW via une ligne de transport qui contourne entièrement le réseau public. Google s'est engagé à acheter de l'électricité provenant de six réacteurs nucléaires de nouvelle génération développés par Kairos Power, visant un déploiement entre 2030 et 2035 pour un total de 500 MW.

Ces accords représentent un changement fondamental : les entreprises technologiques deviennent des clients clés pour les infrastructures énergétiques de la même manière que les fonderies d'aluminium et les aciéries étaient des piliers industriels au XXe siècle. La différence est la vitesse : les Hyperscalers peuvent engager des capitaux et signer des contrats en quelques mois, alors que les infrastructures énergétiques prennent des décennies à construire.

La renaissance nucléaire

Le retour de l'énergie nucléaire est la conséquence la plus spectaculaire de la demande d'électricité de l'IA. Aux États-Unis, aucune nouvelle centrale nucléaire n'était entrée en service depuis plus de deux décennies avant 2023. Cela est en train de changer :

  • Three Mile Island Unité 1 est redémarrée par Constellation Energy pour Microsoft, prévue pour 2028.
  • Vogtle Unité 3 et Unité 4 en Géorgie sont entrées en service en 2023 et 2024 — les premiers nouveaux réacteurs construits aux États-Unis en 30 ans — la demande des data centers étant un facteur clé dans le business case de Southern Company.
  • Petits réacteurs modulaires (SMR) — réacteurs fabriqués en usine de 50 à 300 MW — reçoivent des milliards d'investissements d'Amazon, Google et Microsoft. NuScale, X-energy et TerraPower sont les principaux concurrents, bien que le premier projet commercial de NuScale ait été annulé en 2023 en raison de dépassements de coûts, démontrant que la technologie n'est pas encore totalement sans risque.

L'attrait du nucléaire pour les data centers est spécifique : il fournit une électricité de base sans carbone 24h/24 et 7j/7 que le solaire et l'éolien ne peuvent égaler sans un stockage massif par batteries. Un data center exécutant de grandes charges de travail d'inférence d'IA ne peut tolérer une alimentation intermittente — chaque milliseconde d'arrêt a un coût pour l'utilisateur. Le nucléaire offre le profil de fiabilité dont les opérations d'IA ont besoin.

La France, qui produit déjà plus de 70 % de son électricité à partir du nucléaire, a vu son secteur des data centers croître considérablement alors que les entreprises cherchent à se localiser à proximité d'énergie propre et pilotable. Le gouvernement français a annoncé en 2022 des plans pour construire six nouveaux réacteurs EPR2 et potentiellement huit autres, la demande d'électricité tirée par l'IA étant citée explicitement dans la justification de la politique.

Ce que les gains d'efficacité résolvent — et ne résolvent pas

Le contre-argument standard de l'industrie aux préoccupations concernant la crise énergétique est l'amélioration de l'efficacité. Le GPU H100 de NVIDIA offre environ 30 fois les performances d'inférence d'IA par watt par rapport au A100 d'il y a quatre ans. Le refroidissement liquide, désormais déployé dans la plupart des nouveaux data centers AI Hyperscale, permet des densités de chaleur de plus de 100 kilowatts par rack contre 15 à 20 kW pour les installations refroidies par air — permettant plus de calcul dans une empreinte physique et d'infrastructure électrique réduite.

Mais le paradoxe de Jevons opère pleinement : les gains d'efficacité sont entièrement absorbés par la croissance de la demande. Lorsque l'inférence devient moins chère par requête, le nombre de requêtes explose. Lorsque l'entraînement devient plus efficace, les chercheurs entraînent des modèles plus grands plus fréquemment. La trajectoire nette de consommation d'énergie est fortement ascendante quels que soient les gains d'efficacité par unité.

Anthropic, OpenAI, Google DeepMind et Meta ont tous déployé ou annoncé des modèles plus grands que leurs prédécesseurs en cycles de 12 à 18 mois. Chaque génération nécessite plus de calcul pour l'entraînement, même si l'inférence devient moins chère. L'argument de l'efficacité est réel mais insuffisant en tant que solution unique.

Quelle est la suite : trois trajectoires

La crise énergétique des data centers se résoudra selon l'une des trois trajectoires, ou plus probablement une combinaison des trois :

  • Redistribution géographique : Les data centers migrent vers des régions disposant d'une capacité électrique excédentaire — le sud-ouest américain (vent et solaire), le Québec (hydroélectricité), la Scandinavie (hydroélectricité et géothermie) et éventuellement l'Afrique subsaharienne (capacité hydroélectrique sous-développée). Cela se produit déjà : Microsoft a ouvert un campus de data center de 500 MW à Quincy, Washington, spécifiquement pour son accès à l'hydroélectricité.
  • Flexibilité du côté de la demande : Les charges de travail d'entraînement de l'IA — contrairement à l'inférence — sont décalables dans le temps. Une session d'entraînement de modèle peut être programmée pendant les heures creuses du réseau ou pendant les périodes de production excédentaire d'énergies renouvelables. Google et DeepMind ont déjà déployé des systèmes de ML qui déplacent les calculs non urgents vers des fenêtres réseau à faible carbone, réduisant leur intensité carbone sans réduire le débit.
  • Nouvelle génération à grande échelle : Au-delà du nucléaire, la fusion reste un pari lointain mais reçoit des capitaux sérieux — Commonwealth Fusion Systems a levé 1,8 milliard de dollars en 2021 et vise un réacteur de démonstration d'ici 2025. Plus immédiatement, des projets éoliens offshore dédiés à l'alimentation des data centers sont en phase d'autorisation en mer du Nord et au large de la côte est des États-Unis.

Enseignements pratiques

Pour les équipes d'infrastructure, les investisseurs et les décideurs politiques, les conclusions exploitables de cette crise sont concrètes :

  • La disponibilité de l'électricité est le nouveau terrain : La sélection des sites pour les data centers commence désormais par l'analyse de la capacité du réseau, et non par la géographie ou les routes de fibre. Les régions capables de fournir plus de 500 MW d'énergie fiable attireront des investissements disproportionnés au cours de la prochaine décennie.
  • Les PPAs nucléaires prendront de la valeur : Les accords d'achat d'électricité à long terme avec les opérateurs nucléaires sont sous-évalués par rapport à leur valeur. Les entreprises qui ont verrouillé des PPAs nucléaires de 20 ans en 2023-2024 disposent d'un avantage de coût structurel sur les concurrents dépendant des marchés spot de l'électricité dans les années 2030.
  • Les délais de mise à niveau du réseau sont une contrainte dure : Aucun montant de capital ne peut compresser un délai de permis de sous-station de 6 ans à 18 mois sans réforme réglementaire. Le lobbying pour une réforme des permis — déjà en cours via la Data Center Coalition et des groupes similaires — aura plus d'impact à court terme que tout investissement technologique.
  • Le risque des SMR est réel : Les petits réacteurs modulaires ne sont pas une solution à court terme. Le premier déploiement commercial crédible est 2030, et l'incertitude sur les coûts reste élevée. Les entreprises qui misent sur les SMR comme principale stratégie énergétique pour la fenêtre 2026-2029 sont confrontées à un risque d'exécution.
Partager:
L'IA épuise le réseau : au cœur de la crise énergétique des data centers qui redessine les infrastructures électriques | AIO APEX