AIO APEX

O problema elétrico da IA: como os data centers estão reescrevendo as regras dos mercados de energia

Compartilhar:
O problema elétrico da IA: como os data centers estão reescrevendo as regras dos mercados de energia

Em 2020, os data centers consumiram aproximadamente 200 terawatts-hora de eletricidade globalmente — cerca de 1% da demanda mundial de eletricidade. As estimativas mais recentes da AIE colocam o consumo dos data centers na trajetória para 945 TWh até 2026, impulsionado quase inteiramente por cargas de trabalho de IA. Para contextualizar: todo o país da Alemanha usa cerca de 550 TWh por ano. A eletricidade necessária para treinar e executar os modelos de IA que moldarão 2026 é, por si só, comparável a alimentar uma das maiores economias industriais do mundo.

Isso não é uma preocupação futura. É uma realidade operacional presente para operadores de redes, mercados de energia e empresas que constroem a infraestrutura.

Para onde vai a energia

As cargas de trabalho de IA são substancialmente mais intensivas em energia do que a computação em nuvem tradicional. Uma VM padrão de nuvem fazendo web serving pode consumir 100 watts. Um cluster denso de GPU executando inferência de modelo grande consome 400 a 500 watts por placa GPU, com clusters modernos de aceleradores de IA empacotando milhares de chips em um único rack. Uma GPU H100, o acelerador de IA mais amplamente implantado até 2024, tem uma potência térmica de projeto de 700W. A NVIDIA Blackwell B200 elevou isso para 1.000W por GPU em sua configuração resfriada a ar. Um cluster de 10.000 GPUs consome cerca de 10 megawatts continuamente — o suficiente para alimentar uma pequena cidade.

A métrica Power Usage Effectiveness (PUE) — que mede a eficiência com que um data center usa a eletricidade que recebe — melhorou em toda a indústria, mas rendimentos decrescentes estão se instalando. Os hyperscalers (Google, Microsoft, Amazon, Meta) agora alcançam rotineiramente PUEs entre 1,1 e 1,2 para novas instalações, significando aproximadamente 10–20% de overhead para resfriamento, iluminação e distribuição de energia. Nessas eficiências, o gargalo não é mais o resfriamento: é simplesmente a quantidade bruta de eletricidade que a instalação precisa extrair da rede.

A virada nuclear

A história energética mais significativa na indústria de tecnologia nos últimos dois anos foi a virada em direção à energia nuclear. Em 2023, isso teria parecido marginal. Até meados de 2026, tornou-se uma estratégia explícita para todos os grandes hyperscalers.

A Microsoft assinou um acordo de 20 anos em setembro de 2023 para reiniciar o reator Unidade 1 de Three Mile Island na Pensilvânia, fornecendo 835 MW dedicados a data centers. O Google assinou um acordo para energia dos pequenos reatores modulares da Kairos Power em 2023, com entrega prevista a partir de 2030. A Amazon comprou um campus de data center alimentado por energia nuclear da Talen Energy, garantindo 960 MW de energia quase zero-carbono. A Constellation Energy — a maior operadora nuclear dos EUA — viu suas ações triplicarem à medida que a demanda tecnológica ressuscitou o interesse comercial em ativos que o mercado havia descartado.

O apelo da energia nuclear para data centers de IA é específico: fornece energia firme 24/7 com uma densidade energética muito alta por unidade de terra. Solar e eólica são mais baratas por kWh, mas intermitentes — você não pode operar um cluster de GPU de 100 MW com energia intermitente sem um armazenamento massivo de baterias (caro e intensivo em terra) ou uma conexão de rede de backup que essencialmente requer capacidade de combustível fóssil para existir em algum lugar no sistema.

Energias renováveis: a contabilidade honesta

Todos os grandes hyperscalers publicam compromissos de neutralidade de carbono ou energia renovável. Esses compromissos são reais, mas sua relação com as emissões operacionais reais é mais complicada do que o marketing sugere. O instrumento chave é o Certificado de Energia Renovável (REC) ou o Acordo de Compra de Energia (PPA): uma empresa contrata com uma instalação de energia renovável, recebe certificados representando essa quantidade de geração renovável e os reivindica contra seu consumo no papel.

O problema é a incompatibilidade temporal e geográfica. Um data center do Google consumindo 500 MW na Virgínia às 2 da manhã em uma noite de inverno não está sendo realmente alimentado por uma fazenda solar no Texas que gera seus certificados durante as tardes de verão. Os elétrons que o data center consome vêm do que quer que esteja na rede da Virgínia às 2 da manhã — que, no inverno, é principalmente gás e nuclear. Os certificados renováveis compensam isso em uma base contábil anual, mas as emissões operacionais reais são maiores do que a contabilidade baseada em certificados implica.

A correspondência 24/7 de energia livre de carbono (CFE) — onde o consumo é correspondido à geração hora a hora, local a local — é a métrica mais significativa, e o Google tem sido o mais agressivo em buscá-la. Sua pontuação CFE em 2025 foi de 76% globalmente, que eles consideram insuficiente. A avaliação honesta da posição da indústria em relação às renováveis é: investimento significativo em capacidade renovável, compensação parcial das emissões reais e uma lacuna que está se fechando, mas ainda não foi fechada.

A eficiência como a outra alavanca

A melhora dramática na eficiência dos modelos de IA nos últimos três anos é a parte menos discutida da história energética. O GPT-3 em 2020 exigiu aproximadamente 1.300 MWh para treinar. Modelos de capacidade equivalente treinados em 2025 exigiram uma fração disso, à medida que melhorias algorítmicas (arquiteturas melhores, técnicas de treinamento mais eficientes, destilação) se combinaram com ganhos de hardware.

A mesma dinâmica se aplica à inferência: uma consulta a um assistente de IA de ponta em 2026 usa substancialmente menos energia por consulta do que uma consulta equivalente em 2023, porque os modelos se tornaram mais eficientes e o hardware que os executa melhorou. A eficiência da inferência melhorou aproximadamente 10 vezes em três anos por consulta.

O problema é que o crescimento da demanda superou os ganhos de eficiência. O número de consultas de IA, o tamanho dos modelos sendo implantados e a amplitude das aplicações que usam IA cresceram mais rápido do que as melhorias de eficiência. Este é o clássico paradoxo de Jevons: tornar um recurso mais barato de usar aumenta o consumo total em vez de reduzi-lo.

O que os operadores de rede veem

Para os operadores de redes elétricas, a expansão dos data centers de IA em hiperescala representa um desafio de planejamento como nenhum outro que já enfrentaram. Um único grande projeto de data center pode exigir de 500 MW a 1.000 MW de nova capacidade de geração — tanto quanto construir uma nova cidade. As filas de interconexão de rede na Virgínia, Texas, Geórgia e Arizona — os principais mercados de data centers dos EUA — estão atrasadas por anos. A PJM, a maior operadora de rede dos EUA, relatou 1.200 solicitações de data centers em sua fila de interconexão em 2025, representando mais de 200 GW de capacidade solicitada.

O investimento de capital necessário para construir a infraestrutura de transmissão para atender a essa demanda é estimado em centenas de bilhões de dólares apenas nos EUA. Processos tarifários perante comissões de serviços públicos em todo o país agora estão lidando com a questão de quem paga pelas atualizações de rede exigidas pelo crescimento dos data centers: os próprios data centers, todos os consumidores de eletricidade ou alguma combinação.

A história energética da IA em 2026 não é uma crise — as luzes permaneceram acesas e as instalações estão sendo construídas. Mas é uma remodelação profunda de onde a eletricidade vem, quem paga por ela e como as redes operam. Essas consequências se estenderão muito além de qualquer ciclo de produto de IA.

Compartilhar:
O problema elétrico da IA: como os data centers estão reescrevendo as regras dos mercados de energia | AIO APEX