AIO APEX

AWS négocie la vente de ses puces Trainium AI à des datacenters externes

TechCrunch
Partager:
AWS négocie la vente de ses puces Trainium AI à des datacenters externes

Amazon Web Services est en négociations préliminaires pour vendre ses puces Trainium personnalisées directement à des sociétés tierces — un changement stratégique majeur pour une entreprise qui a historiquement gardé son silicium en interne. Andy Jassy, PDG d'AWS, a évoqué l'idée pour la première fois dans sa lettre aux actionnaires d'avril, et Peter DeSantis, responsable IA d'AWS, a confirmé à Bloomberg le 18 juin que des discussions actives sont en cours. Trainium4, la prochaine génération de la puce, est attendue dans l'année à venir.

Cette motion représenterait le défi le plus direct d'Amazon à la domination de Nvidia sur le marché des accélérateurs IA. Nvidia génère actuellement environ 326 milliards de dollars de revenus annuels, dont la majeure partie provient des ventes de GPU pour datacenters. L'estimation interne d'Amazon situe le potentiel d'une activité indépendante de puces à un "run rate annuel de 50 milliards de dollars" — substantiel, mais loin de déplacer la position actuelle de Nvidia.

Pourquoi Amazon agit maintenant

Les puces Trainium ont été développées à l'origine pour réduire la dépendance d'AWS elle-même aux GPU de Nvidia pour l'entraînement de grands modèles d'IA. Amazon a d'abord déployé Trainium dans ses propres datacenters pour entraîner les modèles d'Alexa et les charges de travail ML internes, et les a mises à disposition des clients AWS via ses instances EC2 Trn1 et Trn2. La logique était simple : le silicium personnalisé coûte moins cher par heure de calcul que l'achat de H100 et H200 de Nvidia aux prix du marché.

Vendre Trainium en externe modifie ce calcul de deux manières. Premièrement, cela crée une nouvelle source de revenus — des ventes de puces plutôt que seulement des frais de cloud computing. Deuxièmement, cela positionne AWS comme un fournisseur de puces plutôt que comme un simple fournisseur de cloud, un rôle qui pourrait devenir de plus en plus important à mesure que les grandes entreprises et les initiatives souveraines d'IA cherchent à construire leur propre infrastructure sans dépendre totalement de la chaîne d'approvisionnement de Nvidia.

Le timing reflète également l'environnement concurrentiel plus large. AMD a réalisé des avancées significatives sur le marché des puces IA avec ses GPU MI300X. Intel repositionne sa fonderie autour des charges de travail IA. Google vend ses puces TPU en externe depuis 2023. La vente de Trainium par Amazon en externe s'alignerait sur un changement industriel vers des marchés du silicium plus ouverts.

Ce qu'apporte Trainium4

Amazon n'a pas divulgué les spécifications détaillées du Trainium4, mais la société l'a décrit comme conçu spécifiquement pour l'entraînement et l'inférence à grande échelle en hyperscale. Les générations précédentes de Trainium ont offert des performances compétitives sur les benchmarks d'entraînement de modèles Transformer, bien que le H200 de Nvidia et l'architecture Blackwell à venir aient conservé des avantages de performance sur la plupart des tâches standard. La disponibilité externe du Trainium4 offrirait aux acheteurs une alternative pour les grands runs d'entraînement où le rapport prix-performance importe plus que le débit de pointe.

Les implications concurrentielles

Pour Nvidia, l'entrée d'Amazon sur le marché externe des puces est un signal à prendre au sérieux même si l'impact financier à court terme est limité. Le fossé de Nvidia a toujours reposé sur trois choses : la performance matérielle, l'écosystème logiciel CUDA et la disponibilité de l'approvisionnement. Trainium fonctionne sur le SDK propriétaire d'AWS, Neuron, plutôt que sur CUDA, ce qui signifie que tout client déplaçant des charges de travail vers Trainium assume un coût de migration — mais pour les nouvelles charges de travail, ou pour les acheteurs prêts à investir dans l'optimisation de Neuron, la différence de coût peut rendre cette migration intéressante.

Aucun acheteur spécifique ni conditions de prix n'ont été divulgués. AWS a indiqué que les discussions en sont à un stade précoce et a refusé de commenter au-delà de l'interview de DeSantis avec Bloomberg.

Originally reported by TechCrunch. Read the original article for additional details.

View original source
Partager: