Das Stromproblem der KI: Wie Rechenzentren die Regeln der Energiemärkte neu schreiben

Im Jahr 2020 verbrauchten Rechenzentren weltweit etwa 200 Terawattstunden Strom – etwa 1 % der weltweiten Stromnachfrage. Die neuesten Schätzungen der IEA gehen davon aus, dass der Verbrauch von Rechenzentren bis 2026 auf 945 TWh ansteigen wird, fast vollständig angetrieben durch KI-Workloads. Zur Einordnung: Das gesamte Land Deutschland verbraucht etwa 550 TWh pro Jahr. Der Strom, der benötigt wird, um die KI-Modelle zu trainieren und zu betreiben, die das Jahr 2026 prägen, ist für sich genommen vergleichbar mit der Versorgung einer der größten Industrievolkswirtschaften der Welt.

Dies ist keine Zukunftssorge. Es ist eine gegenwärtige operative Realität für Netzbetreiber, Energiemärkte und die Unternehmen, die die Infrastruktur aufbauen.

Wohin der Strom fließt

KI-Workloads sind wesentlich stromintensiver als traditionelles Cloud Computing. Eine Standard-Cloud-VM, die Webdienste bereitstellt, verbraucht vielleicht 100 Watt. Ein dichtes GPU-Cluster, das große Modellinferenzen ausführt, verbraucht 400 bis 500 Watt pro GPU-Karte, wobei moderne KI-Beschleunigercluster Tausende von Chips in einem einzigen Rack unterbringen. Eine H100 GPU, der bis 2024 am weitesten verbreitete KI-Beschleuniger, hat eine thermische Auslegungsleistung von 700 W. NVIDIA's Blackwell B200 steigerte dies auf 1.000 W pro GPU in seiner luftgekühlten Konfiguration. Ein 10.000-GPU-Cluster verbraucht kontinuierlich etwa 10 Megawatt – genug, um eine Kleinstadt mit Strom zu versorgen.

Die Kennzahl Power Usage Effectiveness (PUE) – die misst, wie effizient ein Rechenzentrum den Strom nutzt, den es erhält – hat sich in der gesamten Branche verbessert, aber es stellen sich sinkende Erträge ein. Die Hyperscaler (Google, Microsoft, Amazon, Meta) erreichen heute routinemäßig PUEs zwischen 1,1 und 1,2 für neue Anlagen, was etwa 10–20 % Overhead für Kühlung, Beleuchtung und Stromverteilung bedeutet. Bei diesen Effizienzen ist der Engpass nicht mehr die Kühlung: Es ist schlicht die rohe Strommenge, die die Anlage aus dem Netz beziehen muss.

Die nukleare Kehrtwende

Die bedeutendste Energiegeschichte der Technologiebranche in den letzten zwei Jahren war die Hinwendung zur Kernenergie. Im Jahr 2023 hätte dies randständig gewirkt. Bis Mitte 2026 ist es zu einer expliziten Strategie für jeden großen Hyperscaler geworden.

Microsoft unterzeichnete im September 2023 eine 20-Jahres-Vereinbarung zur Wiederinbetriebnahme des Reaktors Block 1 von Three Mile Island in Pennsylvania, der 835 MW für Rechenzentren bereitstellt. Google unterzeichnete 2023 einen Vertrag über Strom aus den kleinen modularen Reaktoren von Kairos Power, mit Lieferung ab 2030. Amazon kaufte einen nuklear betriebenen Rechenzentrums-Campus von Talen Energy und sicherte sich 960 MW nahezu CO2-freien Strom. Constellation Energy – der größte US-Atomkraftbetreiber – hat seine Aktie verdreifacht, da die Technologienachfrage das kommerzielle Interesse an Vermögenswerten wiederbelebt hat, die der Markt abgeschrieben hatte.

Die Attraktivität der Kernenergie für KI-Rechenzentren ist spezifisch: Sie liefert jederzeit verfügbaren Strom mit einer sehr hohen Energiedichte pro Flächeneinheit. Solar und Wind sind pro kWh billiger, aber intermittierend – Sie können ein 100-MW-GPU-Cluster nicht mit intermittierendem Strom betreiben, ohne entweder massive Batteriespeicher (teuer und flächenintensiv) oder eine Backup-Netzverbindung, die im Wesentlichen erfordert, dass irgendwo im System fossile Kapazitäten vorhanden sind.

Erneuerbare Energien: Die ehrliche Bilanz

Alle großen Hyperscaler veröffentlichen Verpflichtungen zur CO2-Neutralität oder zu erneuerbaren Energien. Diese Verpflichtungen sind real, aber ihr Verhältnis zu den tatsächlichen Betriebsemissionen ist komplizierter, als das Marketing vermuten lässt. Das Schlüsselinstrument ist das Erneuerbare-Energien-Zertifikat (REC) oder der Stromabnahmevertrag (PPA): Ein Unternehmen schließt einen Vertrag mit einer Anlage für erneuerbare Energien, erhält Zertifikate, die diese Menge an erneuerbarer Erzeugung repräsentieren, und verrechnet sie auf dem Papier mit seinem Verbrauch.

Das Problem ist die zeitliche und geografische Diskrepanz. Ein Google-Rechenzentrum, das um 2 Uhr morgens in einer Winternacht in Virginia 500 MW bezieht, wird nicht tatsächlich von einem Solarpark in Texas versorgt, der seine Zertifikate an Sommernachmittagen erzeugt. Die Elektronen, die das Rechenzentrum verbraucht, stammen von dem, was um 2 Uhr morgens im Netz von Virginia ist – was im Winter hauptsächlich Gas und Kernenergie ist. Die Erneuerbaren-Zertifikate gleichen dies auf jährlicher Abrechnungsbasis aus, aber die tatsächlichen Betriebsemissionen sind höher, als es die zertifikatsbasierte Abrechnung vermuten lässt.

Das 24/7 Matching von CO2-freiem Strom (CFE) – bei dem der Verbrauch stündlich und standortgenau mit der Erzeugung abgeglichen wird – ist die aussagekräftigere Kennzahl, und Google hat diese am aggressivsten verfolgt. Ihr CFE-Score für 2025 lag weltweit bei 76 %, was sie als unzureichend bezeichnet haben. Die ehrliche Bewertung der Position der Branche zu erneuerbaren Energien ist: erhebliche Investitionen in erneuerbare Kapazitäten, teilweise Kompensation tatsächlicher Emissionen und eine Lücke, die sich schließt, aber noch nicht geschlossen hat.

Effizienz als der andere Hebel

Die dramatische Verbesserung der Effizienz von KI-Modellen in den letzten drei Jahren ist der am wenigsten diskutierte Teil der Energiegschichte. GPT-3 benötigte im Jahr 2020 etwa 1.300 MWh zum Trainieren. Modelle mit gleichwertiger Leistungsfähigkeit, die 2025 trainiert wurden, benötigten nur einen Bruchteil davon, da sich algorithmische Verbesserungen (bessere Architekturen, effizientere Trainingstechniken, Destillation) mit Hardware-Gewinnen verbanden.

Die gleiche Dynamik gilt für die Inferenz: Eine Anfrage an einen modernen KI-Assistenten im Jahr 2026 verbraucht pro Anfrage wesentlich weniger Energie als eine gleichwertige Anfrage im Jahr 2023, weil die Modelle effizienter geworden sind und die Hardware, die sie ausführt, sich verbessert hat. Die Inferenzeffizienz hat sich in drei Jahren pro Anfrage etwa um das Zehnfache verbessert.

Das Problem ist, dass das Nachfragewachstum die Effizienzgewinne überlagert hat. Die Anzahl der KI-Anfragen, die Größe der bereitgestellten Modelle und die Breite der Anwendungen, die KI nutzen, sind alle schneller gewachsen als die Effizienzverbesserungen. Dies ist das klassische Jevons-Paradoxon: Die Ver billigung einer Ressource führt zu einem Anstieg des Gesamtverbrauchs und nicht zu einer Reduzierung.

Was die Netzbetreiber sehen

Für Stromnetzbetreiber stellt die Expansion von Hyperscale-KI-Rechenzentren eine Planungsherausforderung dar, wie sie sie noch nie erlebt haben. Ein einzelnes großes Rechenzentrumsprojekt kann 500 MW bis 1.000 MW neue Erzeugungskapazität erfordern – so viel wie der Bau einer neuen Stadt. Die Netzanschluss-Warteschlangen in Virginia, Texas, Georgia und Arizona – den wichtigsten US-Rechenzentrumsmärkten – sind um Jahre überlastet. PJM, der größte US-Netzbetreiber, meldete im Jahr 2025 1.200 Rechenzentrumsanträge in seiner Netzanschluss-Warteschlange, die über 200 GW angeforderte Kapazität repräsentieren.

Die erforderlichen Kapitalinvestitionen für den Bau der Übertragungsinfrastruktur zur Bedienung dieser Nachfrage werden allein in den USA auf Hunderte von Milliarden Dollar geschätzt. Tarifverfahren vor öffentlichen Versorgungskommissionen im ganzen Land beschäftigen sich nun mit der Frage, wer für die durch das Rechenzentrumswachstum erforderlichen Netzausbauten bezahlt: die Rechenzentren selbst, alle Stromzahler oder eine Kombination.

Die Energiegeschichte der KI im Jahr 2026 ist keine Krise – das Licht ist angeblieben, und die Anlagen werden gebaut. Aber es ist eine tiefgreifende Umgestaltung dessen, woher der Strom kommt, wer dafür bezahlt und wie die Netze funktionieren. Diese Konsequenzen werden weit über jeden KI-Produktzyklus hinausreichen.