OpenAI تكشف عن Jalapeño، أول شريحة ذكاء اصطناعي مخصصة لها بالتعاون مع Broadcom لتقليل الاعتماد على Nvidia

كشفت OpenAI يوم الأربعاء عن Jalapeño، أول شريحة استدلال ذكاء اصطناعي مخصصة لها، صُنعت بالتعاون مع Broadcom. يمثل هذا الإعلان تحولًا كبيرًا في استراتيجية البنية التحتية لـ OpenAI: كانت الشركة تعتمد بشكل كامل تقريبًا على وحدات معالجة الرسوميات (GPU) من Nvidia منذ تأسيسها، ويمثل Jalapeño أول خطوة ملموسة نحو بناء أجهزة تصممها OpenAI وفق مواصفاتها الخاصة بدلاً من شراء منتجات جاهزة من السوق.

الشريحة هي معالج استدلال – أي أنها مصممة لتشغيل نماذج الذكاء الاصطناعي المدربة مسبقًا استجابة لطلبات المستخدمين، وليس لتدريب النماذج من الصفر. هذا هو التركيز الصحيح لمشكلة التكلفة الفورية لـ OpenAI: الاستدلال لمنتجات مثل ChatGPT وAPI يعمل بشكل مستمر على نطاق واسع، ووحدات GPU من Nvidia، رغم أنها ممتازة للتدريب، تحمل تكاليف إضافية كبيرة عند استخدامها بشكل أساسي لأعباء عمل الاستدلال. يمكن لشريحة استدلال مخصصة أن تلغي التكاليف الإضافية للأجهزة والطاقة المرتبطة ببنية GPU العامة.

ادعاءات الأداء والتكلفة

وصف جريج بروكمان، رئيس OpenAI، فلسفة تصميم الشريحة من حيث ملاءمة عبء العمل: "لدينا فهم عميق لعبء العمل. كيف يمكننا بناء شيء يسرع ما هو ممكن؟" تظهر نتائج الاختبارات الأولية "أداءً أفضل بشكل ملحوظ لكل واط مقارنة بأفضل البدائل الحالية"، وفقًا للشركة، مع فوائد خاصة "لتكلفة تشغيل منخفضة عند تشغيل نماذج البرمجة في الوقت الفعلي". لم يتم الإعلان عن أرقام Benchmark محددة.

تأطير الأداء لكل واط مهم. استهلاك الطاقة أصبح بشكل متزايد القيد الرئيسي في مراكز بيانات الذكاء الاصطناعي – وليس القدرة الحاسوبية أو عرض النطاق الترددي للذاكرة. الشريحة التي تقدم نفس إنتاجية الاستدلال باستهلاك واط أقل تقلل تكاليف الكهرباء وتحرر سعة أكبر ضمن ميزانيات طاقة ثابتة. بالنسبة لشركة تدير الاستدلال على النطاق الذي تفعله OpenAI، حتى المكاسب الصغيرة في الكفاءة تتراكم لتؤدي إلى تخفيضات كبيرة في التكاليف.

الشراكة مع Broadcom

Broadcom هو الشريك الطبيعي لهذا النوع من المشاريع. تمتلك الشركة خبرة واسعة في تصميم الدوائر المتكاملة الخاصة بالتطبيقات (ASIC) المخصصة لمشغلي الخدمات فائقة الاتساع – بما في ذلك شرائح TPU التي استخدمتها Google لبناء بنيتها التحتية للذكاء الاصطناعي لأكثر من عقد. تولت Broadcom تصميم السيليكون وتنسيق التصنيع؛ وساهمت OpenAI بمواصفات عبء العمل ومعرفة بنية النموذج التي أفادت تصميم الشريحة.

لم يتم الكشف عن عقدة عملية التصنيع أو الشريك المسبك. بالنظر إلى الجدول الزمني والتركيز على الاستدلال بدلاً من التدريب، فإن عقدتي 3 نانومتر أو 4 نانومتر من TSMC هما الأكثر احتمالاً، رغم أن OpenAI لم تؤكد ذلك.

لماذا الآن، ولماذا الاستدلال أولاً

OpenAI ليست أول مختبر كبير للذكاء الاصطناعي يبني سيليكونًا مخصصًا. تدير Google بنيتها التحتية للذكاء الاصطناعي على شرائح TPU منذ عام 2016. شرائح Trainium من Amazon تشغل أجزاء من أعباء عمل الذكاء الاصطناعي في AWS. نشرت Meta شرائح استدلال مخصصة عبر أنظمة التوصية الخاصة بها. مشروع Maia من Microsoft، الذي تم تطويره بالشراكة مع OpenAI، قيد التطوير منذ عدة سنوات. لكن Jalapeño هي أول شريحة تصممها OpenAI باسمها الخاص، مما يشير إلى تحول استراتيجي وليس مجرد علاقة مورد.

التركيز على الاستدلال يعكس الوضع الاقتصادي الحالي لـ OpenAI. تدريب النماذج الكبيرة هو تكلفة لمرة واحدة لكل إصدار نموذج؛ الاستدلال مستمر ويتوسع مباشرة مع نمو المستخدمين. مع تجاوز ChatGPT مليار مستخدم نشط شهريًا وتوسع أعمال API لـ OpenAI، أصبح الاستدلال المحرك الرئيسي للإنفاق الحاسوبي. امتلاك طبقة الشرائح للاستدلال يمنح OpenAI سيطرة مباشرة على أكبر وأسرع مراكز التكلفة نموًا لديها.

الآثار على Nvidia

Jalapeño ليس تهديدًا لأعمال التدريب لـ Nvidia – تدريب النماذج الحدودية على النطاق الذي تعمل به OpenAI يتطلب نوعًا من الحوسبة المتوازية المرنة والضخمة التي توفرها وحدات GPU من Nvidia والتي لا تستطيع ASICs المخصصة مجاراتها على المدى القصير. لكن الاستدلال قصة مختلفة. إذا عمل Jalapeño كما هو معلن وتم توسيعه إلى النشر الإنتاجي، يمكن لـ OpenAI تحويل جزء كبير من عبء عمل الاستدلال بعيدًا عن أجهزة Nvidia.

الاتجاه الأوسع واضح: كل مختبر كبير للذكاء الاصطناعي ومزود خدمة سحابية يقوم بتطوير بدائل لـ Nvidia لأعباء عمل محددة. هيمنة Nvidia على أجهزة الذكاء الاصطناعي حقيقية لكنها ليست دائمة، والاستدلال – نظرًا لكون خصائص عبء العمل أكثر قابلية للتنبؤ من التدريب – هو القطاع الأسهل للإزاحة بالسيليكون المخصص. Jalapeño، كما ورد لأول مرة من TechCrunch، يوجد حاليًا في مرحلة الاختبار ولم يتم الإعلان عن تاريخ للنشر الإنتاجي.