Le problème électrique de l'IA : comment les centres de données réécrivent les règles des marchés de l'énergie

En 2020, les centres de données ont consommé environ 200 térawattheures d'électricité à l'échelle mondiale, soit environ 1 % de la demande mondiale d'électricité. Les dernières estimations de l'AIE prévoient que la consommation des centres de données atteindra 945 TWh d'ici 2026, presque entièrement tirée par les charges de travail de l'IA. Pour mettre cela en perspective : l'ensemble de l'Allemagne utilise environ 550 TWh par an. L'électricité nécessaire pour former et exécuter les modèles d'IA qui façonneront 2026 est, à elle seule, comparable à l'alimentation de l'une des plus grandes économies industrielles du monde.
Ce n'est pas une préoccupation future. C'est une réalité opérationnelle actuelle pour les gestionnaires de réseaux, les marchés de l'énergie et les entreprises qui construisent les infrastructures.
Où va l'énergie
Les charges de travail de l'IA sont nettement plus gourmandes en énergie que l'informatique en nuage traditionnelle. Une machine virtuelle cloud standard effectuant des services web peut consommer 100 watts. Un cluster GPU dense exécutant des inférences de grands modèles consomme 400 à 500 watts par carte GPU, les clusters d'accélérateurs d'IA modernes embarquant des milliers de puces dans un seul rack. Un GPU H100, l'accélérateur d'IA le plus déployé jusqu'en 2024, a une puissance thermique de conception de 700 W. Le Blackwell B200 de NVIDIA a porté cela à 1000 W par GPU dans sa configuration refroidie par air. Un cluster de 10 000 GPU consomme environ 10 mégawatts en continu, soit de quoi alimenter une petite ville.
La métrique d'efficacité d'utilisation de l'énergie (PUE) — qui mesure l'efficacité avec laquelle un centre de données utilise l'électricité qu'il reçoit — s'est améliorée dans toute l'industrie, mais des rendements décroissants s'installent. Les hyperscalers (Google, Microsoft, Amazon, Meta) atteignent désormais régulièrement des PUE comprises entre 1,1 et 1,2 pour les nouvelles installations, ce qui signifie environ 10 à 20 % de frais généraux pour le refroidissement, l'éclairage et la distribution d'énergie. À ces niveaux d'efficacité, le goulot d'étranglement n'est plus le refroidissement : c'est simplement la quantité brute d'électricité que l'installation doit tirer du réseau.
Le virage nucléaire
L'histoire énergétique la plus marquante de l'industrie technologique au cours des deux dernières années a été le virage vers le nucléaire. En 2023, cela aurait semblé marginal. À la mi-2026, c'est devenu une stratégie explicite pour chaque grand hyperscaler.
Microsoft a signé un accord de 20 ans en septembre 2023 pour redémarrer le réacteur Unité 1 de Three Mile Island en Pennsylvanie, fournissant 835 MW dédiés aux centres de données. Google a signé un accord pour l'énergie des petits réacteurs modulaires de Kairos Power en 2023, avec une livraison prévue à partir de 2030. Amazon a acheté un campus de centre de données alimenté par nucléaire à Talen Energy, sécurisant 960 MW d'énergie quasi zéro carbone. Constellation Energy, le plus grand exploitant nucléaire américain, a vu son action tripler alors que la demande technologique a ravivé l'intérêt commercial pour des actifs que le marché avait radiés.
L'attrait du nucléaire pour les centres de données d'IA est spécifique : il fournit une énergie ferme 24h/24 et 7j/7 avec une très haute densité énergétique par unité de terrain. Le solaire et l'éolien sont moins chers par kWh mais intermittents — vous ne pouvez pas faire fonctionner un cluster GPU de 100 MW avec une énergie intermittente sans soit un stockage massif par batteries (coûteux et gourmand en espace) soit une connexion de secours au réseau qui nécessite essentiellement qu'une capacité fossile existe quelque part dans le système.
Les énergies renouvelables : la comptabilité honnête
Tous les grands hyperscalers publient des engagements de neutralité carbone ou d'énergie renouvelable. Ces engagements sont réels, mais leur relation avec les émissions opérationnelles réelles est plus compliquée que ce que le marketing suggère. L'instrument clé est le certificat d'énergie renouvelable (REC) ou l'accord d'achat d'énergie (PPA) : une entreprise contracte avec une installation d'énergie renouvelable, reçoit des certificats représentant cette quantité de production renouvelable, et les revendique contre sa consommation sur le papier.
Le problème est le décalage temporel et géographique. Un centre de données Google consommant 500 MW en Virginie à 2 heures du matin par une nuit d'hiver n'est pas réellement alimenté par une ferme solaire au Texas qui génère ses certificats pendant les après-midis d'été. Les électrons que le centre de données consomme proviennent de ce qui se trouve sur le réseau de Virginie à 2 heures du matin — qui, en hiver, est principalement du gaz et du nucléaire. Les certificats renouvelables compensent cela sur une base comptable annuelle, mais les émissions opérationnelles réelles sont plus élevées que ce que la comptabilité basée sur les certificats implique.
La correspondance 24/7 d'énergie sans carbone (CFE) — où la consommation est appariée à la production heure par heure, lieu par lieu — est la métrique la plus significative, et Google a été le plus agressif dans sa poursuite. Leur score CFE pour 2025 était de 76 % au niveau mondial, ce qu'ils ont jugé insuffisant. L'évaluation honnête de la position de l'industrie en matière d'énergies renouvelables est : investissement significatif dans la capacité renouvelable, compensation partielle des émissions réelles, et un écart qui se réduit mais ne s'est pas encore refermé.
L'efficacité comme autre levier
L'amélioration spectaculaire de l'efficacité des modèles d'IA au cours des trois dernières années est la partie la moins discutée de l'histoire énergétique. GPT-3 en 2020 nécessitait environ 1 300 MWh pour être entraîné. Des modèles de capacité équivalente entraînés en 2025 ont nécessité une fraction de cela, car les améliorations algorithmiques (meilleures architectures, techniques d'entraînement plus efficaces, distillation) se sont combinées aux gains matériels.
La même dynamique s'applique à l'inférence : une requête à un assistant d'IA de pointe en 2026 utilise considérablement moins d'énergie par requête qu'une requête équivalente en 2023, car les modèles sont devenus plus efficaces et le matériel qui les exécute s'est amélioré. L'efficacité de l'inférence s'est améliorée d'environ 10 fois en trois ans par requête.
Le problème est que la croissance de la demande a submergé les gains d'efficacité. Le nombre de requêtes d'IA, la taille des modèles déployés et l'étendue des applications utilisant l'IA ont tous augmenté plus rapidement que les améliorations d'efficacité. C'est le paradoxe classique de Jevons : rendre une ressource moins chère à utiliser augmente la consommation totale plutôt que de la réduire.
Ce que voient les gestionnaires de réseau
Pour les gestionnaires de réseaux électriques, l'expansion des centres de données d'IA à hyperscale représente un défi de planification comme ils n'en ont jamais connu. Un seul grand projet de centre de données peut nécessiter de 500 MW à 1 000 MW de nouvelle capacité de production — autant que la construction d'une nouvelle ville. Les files d'attente d'interconnexion au réseau en Virginie, au Texas, en Géorgie et en Arizona — les principaux marchés américains de centres de données — sont engorgées pour des années. PJM, le plus grand gestionnaire de réseau américain, a signalé 1 200 demandes de centres de données dans sa file d'attente d'interconnexion en 2025, représentant plus de 200 GW de capacité demandée.
L'investissement en capital nécessaire pour construire l'infrastructure de transmission afin de répondre à cette demande est estimé à des centaines de milliards de dollars rien qu'aux États-Unis. Les dossiers tarifaires devant les commissions de services publics à travers le pays sont désormais confrontés à la question de savoir qui paie pour les mises à niveau du réseau requises par la croissance des centres de données : les centres de données eux-mêmes, tous les consommateurs d'électricité, ou une combinaison.
L'histoire énergétique de l'IA en 2026 n'est pas une crise — les lumières sont restées allumées et les installations sont en cours de construction. Mais c'est une profonde refonte de la provenance de l'électricité, de qui paie pour elle et du fonctionnement des réseaux. Ces conséquences s'étendront bien au-delà de tout cycle de produit d'IA.