OpenAI از تراشه سفارشی Jalapeño با همکاری Broadcom رونمایی کرد؛ گامی برای کاهش وابستگی به Nvidia

OpenAI روز چهارشنبه از تراشه Jalapeño رونمایی کرد؛ اولین چیپ استنتاج هوش مصنوعی اختصاصی این شرکت که با همکاری Broadcom طراحی شده است. این رونمایی نشانهای از تغییر مهم در استراتژی زیرساخت OpenAI است؛ شرکتی که از بدو تأسیس تقریباً بهطور کامل به GPUهای Nvidia متکی بوده. Jalapeño اولین گام ملموس OpenAI در مسیر ساخت سختافزاری است که با مشخصات دقیق خودش طراحی و تولید میشود، نه اینکه از بازار خریداری شود.
Jalapeño یک چیپ استنتاج است؛ یعنی برای اجرای مدلهای هوش مصنوعی از پیش آموزشدیده در پاسخ به درخواستهای کاربران طراحی شده، نه برای آموزش مدلها از صفر. این تمرکز دقیقاً پاسخ به مشکل هزینهای فوری OpenAI است: استنتاج برای محصولاتی مثل ChatGPT و API بهصورت پیوسته و در مقیاس عظیم اجرا میشود و GPUهای Nvidia، با اینکه برای آموزش ایدهآل هستند، وقتی عمدتاً برای بارهای کاری استنتاج به کار میروند، هزینههای سربار قابلتوجهی تحمیل میکنند. یک چیپ استنتاج اختصاصی میتواند این اضافهبار سختافزاری و مصرف برق معماری GPU همهمنظوره را حذف کند.
ادعاهای عملکرد و هزینه
گرگ براکمن، رئیس OpenAI، فلسفه طراحی این تراشه را بر پایه تناسب با بار کاری توضیح داد: «ما درک عمیقی از بار کاری خود داریم. چطور میتوانیم چیزی بسازیم که تواناییهای موجود را شتاب بدهد؟» نتایج آزمایشهای اولیه نیز به گفته این شرکت، «نسبت عملکرد به مصرف انرژی بهطور قابلتوجهی بهتر از بهترین گزینههای موجود» را نشان میدهد، با مزیت ویژه در «هزینه عملیاتی پایینتر برای اجرای مدلهای کدنویسی بلادرنگ». با این حال، ارقام Benchmark مشخصی منتشر نشد.
تمرکز روی نسبت عملکرد به مصرف انرژی قابلتوجه است. مصرف برق بهتدریج به اصلیترین محدودیت در مراکز داده هوش مصنوعی تبدیل شده، نه ظرفیت محاسباتی یا پهنای باند حافظه. تراشهای که توان استنتاج یکسانی را با وات کمتر ارائه دهد، هزینه برق را کاهش میدهد و در بودجههای ثابت انرژی، ظرفیت بیشتری آزاد میکند. برای شرکتی که استنتاج را در مقیاس OpenAI اجرا میکند، حتی بهبودهای کوچک در بهرهوری به صرفهجوییهای هزینهای چشمگیری تبدیل میشود.
همکاری با Broadcom
Broadcom انتخاب طبیعی برای این پروژه بود. این شرکت سابقه گستردهای در طراحی ASIC سفارشی برای غولهای فناوری ابری دارد، از جمله چیپهای TPU که Google بیش از یک دهه است از آنها برای زیرساخت هوش مصنوعی خود استفاده میکند. در این همکاری، Broadcom مسئولیت طراحی سیلیکون و هماهنگی تولید را بر عهده داشت و OpenAI مشخصات بار کاری و دانش معماری مدل را که در طراحی چیپ به کار گرفته شد، فراهم کرد.
نود فرآیندی و شریک ساخت این چیپ اعلام نشد. با توجه به جدول زمانی پروژه و تمرکز بر استنتاج بهجای آموزش، گرههای ۳ یا ۴ نانومتری TSMC محتملترین گزینهها به نظر میرسند، هرچند OpenAI این موضوع را تأیید نکرده است.
چرا اکنون و چرا اولویت با استنتاج
OpenAI اولین آزمایشگاه بزرگ هوش مصنوعی نیست که به سراغ سیلیکون اختصاصی میرود. Google از سال ۲۰۱۶ زیرساخت هوش مصنوعی خود را روی TPUها اجرا میکند. چیپهای Trainium آمازون بخشی از بارهای کاری هوش مصنوعی AWS را تأمین میکنند. Meta هم چیپهای استنتاج سفارشی را در سیستمهای توصیهساز خود به کار گرفته است. پروژه Maia مایکروسافت نیز که با همکاری OpenAI توسعه یافته، چند سالی است در جریان است. اما Jalapeño اولین چیپی است که OpenAI با برند خودش طراحی کرده؛ و این یک تغییر استراتژیک واقعی است، نه صرفاً یک رابطه با تأمینکننده.
این تمرکز بر استنتاج، اقتصاد فعلی OpenAI را بازتاب میدهد. آموزش مدلهای بزرگ یک هزینه یکباره به ازای هر نسخه است، اما استنتاج پیوسته است و مستقیماً با رشد کاربران مقیاس پیدا میکند. با عبور ChatGPT از مرز یک میلیارد کاربر فعال ماهانه و گسترش کسبوکار API، استنتاج به بزرگترین موتور هزینههای محاسباتی OpenAI تبدیل شده است. کنترل لایه چیپ برای استنتاج یعنی کنترل مستقیم بر این مرکز هزینه.
پیامدها برای Nvidia
Jalapeño تهدیدی برای کسبوکار آموزش Nvidia نیست. آموزش مدلهای frontier در مقیاس OpenAI نیازمند محاسبات موازی عظیم و انعطافپذیری است که GPUهای Nvidia ارائه میدهند و ASICهای سفارشی در کوتاهمدت نمیتوانند با آن رقابت کنند. اما استنتاج داستان دیگری دارد. اگر Jalapeño آنطور که ادعا میشود عمل کند و به استقرار تولیدی برسد، OpenAI میتواند بخش قابلتوجهی از بار کاری استنتاج خود را از سختافزار Nvidia به این چیپ اختصاصی منتقل کند.
روند کلیتر اما روشن است: تقریباً هر آزمایشگاه بزرگ هوش مصنوعی و ارائهدهنده ابری در حال توسعه جایگزینهایی برای Nvidia در بارهای کاری خاص است. سلطه Nvidia بر سختافزار هوش مصنوعی واقعی است، اما دائمی نیست؛ و استنتاج، بهخاطر ویژگیهای بار کاری پیشبینیپذیرترش نسبت به آموزش، آسانترین بخش برای جایگزینی با سیلیکون اختصاصی است. Jalapeño که اولین بار توسط TechCrunch گزارش شد، در حال حاضر در مرحله آزمایش به سر میبرد و تاریخ استقرار تولیدی آن هنوز اعلام نشده است.
Originally reported by TechCrunch. Read the original article for additional details.
View original source