AIO APEX

La IA está agotando la red eléctrica: la crisis energética de los centros de datos que está remodelando la infraestructura energética

Compartir:
La IA está agotando la red eléctrica: la crisis energética de los centros de datos que está remodelando la infraestructura energética

Los números no mienten

En 2023, los centros de datos consumieron aproximadamente 460 teravatios-hora (TWh) de electricidad a nivel mundial, aproximadamente el 2% de la demanda total mundial de electricidad. La Agencia Internacional de la Energía proyecta que para 2026 esa cifra se duplicará a más de 1000 TWh anuales, impulsada casi en su totalidad por cargas de trabajo de entrenamiento e inferencia de IA. Para ponerlo en contexto: 1000 TWh es más electricidad de la que consume toda Alemania en un año.

Una sola ejecución de entrenamiento de IA a gran escala, como las utilizadas para desarrollar modelos frontera, puede consumir de 50 a 100 gigavatios-hora (GWh) de electricidad. Se estima que el entrenamiento de GPT-4 utilizó aproximadamente 50 GWh. La inferencia, el proceso de ejecutar un modelo entrenado para responder consultas, escala aún más rápido: con millones de usuarios activos diarios por cada gran producto de IA, la demanda de inferencia está superando ahora a la demanda de entrenamiento en el consumo total de energía en muchas instalaciones de Hyperscaler.

La red ya está cediendo

PJM Interconnection, el mayor operador de red eléctrica de América del Norte que cubre 13 estados y Washington D.C., advirtió en 2024 que la demanda proyectada de electricidad para la próxima década había aumentado un 40% en comparación con su pronóstico de 2022, en gran parte debido a los centros de datos. En el norte de Virginia, hogar de la concentración más densa de centros de datos del mundo ("Data Center Alley"), las empresas de servicios públicos locales han impuesto moratorias de capacidad en algunas subestaciones porque la red simplemente no puede suministrar más energía sin años de actualizaciones de infraestructura.

Irlanda, que alberga centros de datos europeos para Google, Meta, Amazon y Microsoft, vio a los centros de datos consumir el 21% de toda la electricidad nacional en 2023. El operador de la red irlandesa EirGrid ha comenzado a restringir nuevas conexiones de centros de datos en el área de Dublín hasta al menos 2028. Singapur impuso una moratoria de tres años a la construcción de nuevos centros de datos desde 2019 hasta 2022 por razones idénticas, levantándola solo después de asegurar compromisos de energía verde.

El cuello de botella no es solo la generación, sino la capacidad de transmisión y de subestaciones. Construir una nueva subestación de alta tensión toma de 4 a 7 años en los Estados Unidos debido a los permisos, las limitaciones de la cadena de suministro para grandes transformadores de potencia y la coordinación con las empresas de servicios públicos. La infraestructura de IA se implementa en meses. La brecha entre los plazos de demanda y los plazos de actualización de la red es el punto central de tensión de esta crisis.

Alianzas con empresas de servicios públicos: un nuevo modelo industrial

Ante las limitaciones de la red, los Hyperscalers están evitando la contratación tradicional de servicios públicos y negociando directamente con los productores de energía. Microsoft firmó un acuerdo de compra de energía (PPA) por 20 años con Constellation Energy en 2023 para reiniciar la Unidad 1 de la planta nuclear de Three Mile Island, que había sido cerrada en 2019 por razones económicas. Se estima que el acuerdo supera los 3000 millones de dólares y suministrará aproximadamente 835 megavatios (MW) de energía base libre de carbono exclusivamente para los centros de datos de Microsoft.

Amazon ha adoptado un enfoque diferente, adquiriendo un campus de centro de datos ubicado directamente junto a la planta nuclear de Susquehanna en Pensilvania, asegurando una alimentación dedicada de 960 MW a través de una línea de transmisión que evita por completo la red pública. Google se ha comprometido a comprar energía de seis reactores nucleares de próxima generación desarrollados por Kairos Power, con el objetivo de implementarlos entre 2030 y 2035 por un total de 500 MW.

Estos acuerdos representan un cambio fundamental: las empresas tecnológicas se están convirtiendo en clientes ancla para la infraestructura energética de la misma manera que las fundiciones de aluminio y las acerías fueron anclas industriales en el siglo XX. La diferencia es la velocidad: los Hyperscalers pueden comprometer capital y firmar contratos en meses, mientras que la infraestructura energética tarda décadas en construirse.

El renacimiento nuclear

El regreso de la energía nuclear es la consecuencia más dramática de la demanda energética de la IA. En los Estados Unidos, ninguna planta nuclear nueva había entrado en funcionamiento en más de dos décadas antes de 2023. Eso ahora está cambiando:

  • Three Mile Island Unidad 1 está siendo reiniciada por Constellation Energy para Microsoft, programada para 2028.
  • Vogtle Unidad 3 y Unidad 4 en Georgia entraron en funcionamiento en 2023 y 2024, los primeros reactores nuevos construidos en EE. UU. en 30 años, con la demanda de los centros de datos como un factor clave en el caso de negocio de Southern Company.
  • Pequeños Reactores Modulares (SMR) — reactores fabricados en fábrica en el rango de 50 a 300 MW — están recibiendo miles de millones en inversiones de Amazon, Google y Microsoft. NuScale, X-energy y TerraPower son los principales contendientes, aunque el primer proyecto comercial de NuScale fue cancelado en 2023 debido a sobrecostos, lo que demuestra que la tecnología aún no está completamente libre de riesgos.

El atractivo de la energía nuclear para los centros de datos es específico: proporciona energía base libre de carbono las 24 horas del día, los 7 días de la semana que la solar y la eólica no pueden igualar sin un almacenamiento masivo de baterías. Un centro de datos que ejecuta grandes cargas de trabajo de inferencia de IA no puede tolerar la energía intermitente: cada milisegundo de inactividad tiene un costo para el usuario. La nuclear ofrece el perfil de fiabilidad que requieren las operaciones de IA.

Francia, que ya genera más del 70% de su electricidad a partir de energía nuclear, ha visto crecer sustancialmente su sector de centros de datos a medida que las empresas buscan ubicarse junto a energía limpia despachable. El gobierno francés anunció en 2022 planes para construir seis nuevos reactores EPR2 y posiblemente ocho más, citando explícitamente la demanda de electricidad impulsada por la IA en la justificación de la política.

Qué están resolviendo las ganancias de eficiencia — y qué no

El contraargumento estándar de la industria a las preocupaciones sobre la crisis energética es la mejora de la eficiencia. La GPU H100 de NVIDIA ofrece aproximadamente 30 veces el rendimiento de inferencia de IA por vatio en comparación con la A100 de hace cuatro años. La refrigeración líquida, que ahora se implementa en la mayoría de los nuevos centros de datos de IA Hyperscale, permite densidades de calor de más de 100 kilovatios por rack frente a 15 a 20 kW para instalaciones refrigeradas por aire, lo que permite más computación en una menor huella física y de infraestructura energética.

Pero la Paradoja de Jevons está operando en plena fuerza: las ganancias de eficiencia están siendo consumidas completamente por el crecimiento de la demanda. Cuando la inferencia se vuelve más barata por consulta, el número de consultas explota. Cuando el entrenamiento se vuelve más eficiente, los investigadores entrenan modelos más grandes con mayor frecuencia. La trayectoria neta de consumo de energía es marcadamente ascendente independientemente de las mejoras de eficiencia por unidad.

Anthropic, OpenAI, Google DeepMind y Meta han implementado o anunciado modelos más grandes que sus predecesores en ciclos de 12 a 18 meses. Cada generación requiere más computación para el entrenamiento, incluso si la inferencia se vuelve más barata. El argumento de la eficiencia es real pero insuficiente como solución independiente.

Qué viene después: tres trayectorias

La crisis energética de los centros de datos se resolverá a lo largo de una de tres trayectorias, o más probablemente una combinación de las tres:

  • Redistribución geográfica: Los centros de datos migran a regiones con capacidad energética excedente: el suroeste estadounidense (viento y solar), Quebec (hidroeléctrica), Escandinavia (hidroeléctrica y geotérmica) y, eventualmente, el África subsahariana (capacidad hidroeléctrica subdesarrollada). Esto ya está sucediendo: Microsoft abrió un campus de centro de datos de 500 MW en Quincy, Washington, específicamente por su acceso a energía hidroeléctrica.
  • Flexibilidad del lado de la demanda: Las cargas de trabajo de entrenamiento de IA — a diferencia de la inferencia — son desplazables en el tiempo. Una ejecución de entrenamiento de modelo puede programarse durante horas de baja demanda de la red o durante períodos de exceso de generación renovable. Google y DeepMind ya han implementado sistemas de ML que desplazan la computación no urgente a ventanas de red de baja carbono, reduciendo su intensidad de carbono sin reducir el rendimiento.
  • Nueva generación a escala: Más allá de la nuclear, la fusión sigue siendo una posibilidad remota pero está recibiendo capital serio: Commonwealth Fusion Systems recaudó 1800 millones de dólares en 2021 y apunta a un reactor de demostración para 2025. De manera más inmediata, los proyectos eólicos marinos dedicados a alimentar centros de datos están en etapas de permisos en el Mar del Norte y frente a la costa este de EE. UU.

Conclusiones prácticas

Para los equipos de infraestructura, inversores y responsables políticos, las conclusiones prácticas de esta crisis son concretas:

  • La disponibilidad de energía es el nuevo terreno: La selección de sitios para centros de datos ahora comienza con el análisis de la capacidad de la red, no con la geografía o las rutas de fibra. Las regiones que puedan entregar más de 500 MW de energía confiable atraerán inversiones desproporcionadas durante la próxima década.
  • Los PPAs nucleares se apreciarán: Los acuerdos de compra de energía a largo plazo con operadores nucleares están infravalorados en relación con su valor. Las empresas que aseguraron PPAs nucleares de 20 años en 2023-2024 tienen una ventaja de costos estructural sobre los competidores que dependen de los mercados eléctricos spot durante la década de 2030.
  • Los plazos de actualización de la red son una restricción dura: Ninguna cantidad de capital puede comprimir un plazo de permisos de subestación de 6 años a 18 meses sin una reforma regulatoria. El cabildeo para la reforma de permisos — que ya está ocurriendo a través de la Data Center Coalition y grupos similares — tendrá más impacto a corto plazo que cualquier inversión tecnológica.
  • El riesgo de los SMR es real: Los pequeños reactores modulares no son una solución a corto plazo. El despliegue comercial creíble más temprano es 2030, y la incertidumbre de costos sigue siendo alta. Las empresas que apuestan por los SMR como su principal estrategia energética para la ventana 2026-2029 enfrentan un riesgo de ejecución.
Compartir:
La IA está agotando la red eléctrica: la crisis energética de los centros de datos que está remodelando la infraestructura energética | AIO APEX