AIO APEX

AWS negocia venda de chips Trainium de IA para datacenters externos

TechCrunch
Compartilhar:
AWS negocia venda de chips Trainium de IA para datacenters externos

Amazon Web Services está em negociações iniciais para vender seus chips Trainium personalizados diretamente a empresas terceiras — uma mudança estratégica significativa para uma empresa que historicamente manteve seu silício internamente. O CEO da AWS, Andy Jassy, mencionou a ideia pela primeira vez em sua carta aos acionistas de abril, e o chefe de IA da AWS, Peter DeSantis, confirmou à Bloomberg em 18 de junho que discussões ativas estão em andamento. O Trainium4, a próxima geração do chip, é esperado dentro do próximo ano.

O movimento representaria o desafio mais direto da Amazon até agora ao domínio da Nvidia no mercado de aceleradores de IA. A Nvidia atualmente gera cerca de US$ 326 bilhões em receita anual, a maior parte impulsionada por vendas de GPU para datacenters. A estimativa interna da Amazon coloca o potencial de um negócio independente de chips em um "run rate anual de US$ 50 bilhões" — substancial, embora longe de deslocar a posição atual da Nvidia.

Por que a Amazon está fazendo esse movimento agora

Os chips Trainium foram originalmente desenvolvidos para reduzir a dependência da própria AWS das GPUs da Nvidia para treinar grandes modelos de IA. A Amazon implantou o Trainium pela primeira vez em seus próprios datacenters para treinar modelos da Alexa e cargas de trabalho internas de ML, e os disponibilizou para clientes da AWS por meio de suas instâncias EC2 Trn1 e Trn2. A lógica era simples: silício personalizado custa menos por hora de computação do que comprar H100 e H200 da Nvidia a preços de mercado.

Vender o Trainium externamente muda esse cálculo de duas maneiras. Primeiro, cria um novo fluxo de receita — vendas de chips em vez de apenas taxas de computação em nuvem. Segundo, posiciona a AWS como fornecedora de chips em vez de apenas provedora de nuvem, um papel que pode se tornar cada vez mais importante à medida que grandes empresas e iniciativas soberanas de IA buscam construir sua própria infraestrutura sem dependência total da cadeia de suprimentos da Nvidia.

O momento também reflete o ambiente competitivo mais amplo. A AMD fez avanços significativos no mercado de chips de IA com suas GPUs MI300X. A Intel está reposicionando sua fundição em torno de cargas de trabalho de IA. O Google vende seus chips TPU externamente desde 2023. A Amazon vender o Trainium externamente estaria alinhada com uma mudança no setor em direção a mercados de silício mais abertos.

O que o Trainium4 traz

A Amazon não divulgou especificações detalhadas do Trainium4, mas a empresa o descreveu como projetado especificamente para treinamento e inferência de IA em grande escala em hiperescala. As gerações anteriores do Trainium ofereceram desempenho competitivo em benchmarks de treinamento de modelos Transformer, embora o H200 da Nvidia e a próxima arquitetura Blackwell tenham mantido vantagens de desempenho na maioria das tarefas padrão. A disponibilidade externa do Trainium4 daria aos compradores uma alternativa para grandes execuções de treinamento onde a relação preço-desempenho é mais importante que o throughput máximo.

As implicações competitivas

Para a Nvidia, a entrada da Amazon no mercado externo de chips é um sinal que merece ser levado a sério, mesmo que o impacto financeiro de curto prazo seja limitado. O fosso da Nvidia sempre se baseou em três coisas: desempenho de hardware, o ecossistema de software CUDA e disponibilidade de fornecimento. O Trainium é executado no SDK próprio da AWS, o Neuron, em vez do CUDA, o que significa que qualquer cliente que mova cargas de trabalho para o Trainium assume um custo de migração — mas para novas cargas de trabalho, ou para compradores dispostos a investir na otimização do Neuron, a diferença de custo pode tornar essa migração válida.

Nenhum comprador específico ou termos de preço foram divulgados. A AWS afirmou que as discussões estão em estágio inicial e se recusou a comentar além da entrevista de DeSantis à Bloomberg.

Originally reported by TechCrunch. Read the original article for additional details.

View original source
Compartilhar: