OpenAI از تراشه سفارشی Jalapeño با همکاری Broadcom رونمایی کرد؛ گامی برای کاهش وابستگی به Nvidia

OpenAI روز چهارشنبه از تراشه Jalapeño رونمایی کرد؛ اولین چیپ استنتاج هوش مصنوعی اختصاصی این شرکت که با همکاری Broadcom طراحی شده است. این رونمایی نشانه‌ای از تغییر مهم در استراتژی زیرساخت OpenAI است؛ شرکتی که از بدو تأسیس تقریباً به‌طور کامل به GPUهای Nvidia متکی بوده. Jalapeño اولین گام ملموس OpenAI در مسیر ساخت سخت‌افزاری است که با مشخصات دقیق خودش طراحی و تولید می‌شود، نه اینکه از بازار خریداری شود.

Jalapeño یک چیپ استنتاج است؛ یعنی برای اجرای مدل‌های هوش مصنوعی از پیش آموزش‌دیده در پاسخ به درخواست‌های کاربران طراحی شده، نه برای آموزش مدل‌ها از صفر. این تمرکز دقیقاً پاسخ به مشکل هزینه‌ای فوری OpenAI است: استنتاج برای محصولاتی مثل ChatGPT و API به‌صورت پیوسته و در مقیاس عظیم اجرا می‌شود و GPUهای Nvidia، با اینکه برای آموزش ایده‌آل هستند، وقتی عمدتاً برای بارهای کاری استنتاج به کار می‌روند، هزینه‌های سربار قابل‌توجهی تحمیل می‌کنند. یک چیپ استنتاج اختصاصی می‌تواند این اضافه‌بار سخت‌افزاری و مصرف برق معماری GPU همه‌منظوره را حذف کند.

ادعاهای عملکرد و هزینه

گرگ براکمن، رئیس OpenAI، فلسفه طراحی این تراشه را بر پایه تناسب با بار کاری توضیح داد: «ما درک عمیقی از بار کاری خود داریم. چطور می‌توانیم چیزی بسازیم که توانایی‌های موجود را شتاب بدهد؟» نتایج آزمایش‌های اولیه نیز به گفته این شرکت، «نسبت عملکرد به مصرف انرژی به‌طور قابل‌توجهی بهتر از بهترین گزینه‌های موجود» را نشان می‌دهد، با مزیت ویژه در «هزینه عملیاتی پایین‌تر برای اجرای مدل‌های کدنویسی بلادرنگ». با این حال، ارقام Benchmark مشخصی منتشر نشد.

تمرکز روی نسبت عملکرد به مصرف انرژی قابل‌توجه است. مصرف برق به‌تدریج به اصلی‌ترین محدودیت در مراکز داده هوش مصنوعی تبدیل شده، نه ظرفیت محاسباتی یا پهنای باند حافظه. تراشه‌ای که توان استنتاج یکسانی را با وات کمتر ارائه دهد، هزینه برق را کاهش می‌دهد و در بودجه‌های ثابت انرژی، ظرفیت بیشتری آزاد می‌کند. برای شرکتی که استنتاج را در مقیاس OpenAI اجرا می‌کند، حتی بهبودهای کوچک در بهره‌وری به صرفه‌جویی‌های هزینه‌ای چشمگیری تبدیل می‌شود.

همکاری با Broadcom

Broadcom انتخاب طبیعی برای این پروژه بود. این شرکت سابقه گسترده‌ای در طراحی ASIC سفارشی برای غول‌های فناوری ابری دارد، از جمله چیپ‌های TPU که Google بیش از یک دهه است از آن‌ها برای زیرساخت هوش مصنوعی خود استفاده می‌کند. در این همکاری، Broadcom مسئولیت طراحی سیلیکون و هماهنگی تولید را بر عهده داشت و OpenAI مشخصات بار کاری و دانش معماری مدل را که در طراحی چیپ به کار گرفته شد، فراهم کرد.

نود فرآیندی و شریک ساخت این چیپ اعلام نشد. با توجه به جدول زمانی پروژه و تمرکز بر استنتاج به‌جای آموزش، گره‌های ۳ یا ۴ نانومتری TSMC محتمل‌ترین گزینه‌ها به نظر می‌رسند، هرچند OpenAI این موضوع را تأیید نکرده است.

چرا اکنون و چرا اولویت با استنتاج

OpenAI اولین آزمایشگاه بزرگ هوش مصنوعی نیست که به سراغ سیلیکون اختصاصی می‌رود. Google از سال ۲۰۱۶ زیرساخت هوش مصنوعی خود را روی TPUها اجرا می‌کند. چیپ‌های Trainium آمازون بخشی از بارهای کاری هوش مصنوعی AWS را تأمین می‌کنند. Meta هم چیپ‌های استنتاج سفارشی را در سیستم‌های توصیه‌ساز خود به کار گرفته است. پروژه Maia مایکروسافت نیز که با همکاری OpenAI توسعه یافته، چند سالی است در جریان است. اما Jalapeño اولین چیپی است که OpenAI با برند خودش طراحی کرده؛ و این یک تغییر استراتژیک واقعی است، نه صرفاً یک رابطه با تأمین‌کننده.

این تمرکز بر استنتاج، اقتصاد فعلی OpenAI را بازتاب می‌دهد. آموزش مدل‌های بزرگ یک هزینه یک‌باره به ازای هر نسخه است، اما استنتاج پیوسته است و مستقیماً با رشد کاربران مقیاس پیدا می‌کند. با عبور ChatGPT از مرز یک میلیارد کاربر فعال ماهانه و گسترش کسب‌وکار API، استنتاج به بزرگ‌ترین موتور هزینه‌های محاسباتی OpenAI تبدیل شده است. کنترل لایه چیپ برای استنتاج یعنی کنترل مستقیم بر این مرکز هزینه.

پیامدها برای Nvidia

Jalapeño تهدیدی برای کسب‌وکار آموزش Nvidia نیست. آموزش مدل‌های frontier در مقیاس OpenAI نیازمند محاسبات موازی عظیم و انعطاف‌پذیری است که GPUهای Nvidia ارائه می‌دهند و ASICهای سفارشی در کوتاه‌مدت نمی‌توانند با آن رقابت کنند. اما استنتاج داستان دیگری دارد. اگر Jalapeño آن‌طور که ادعا می‌شود عمل کند و به استقرار تولیدی برسد، OpenAI می‌تواند بخش قابل‌توجهی از بار کاری استنتاج خود را از سخت‌افزار Nvidia به این چیپ اختصاصی منتقل کند.

روند کلی‌تر اما روشن است: تقریباً هر آزمایشگاه بزرگ هوش مصنوعی و ارائه‌دهنده ابری در حال توسعه جایگزین‌هایی برای Nvidia در بارهای کاری خاص است. سلطه Nvidia بر سخت‌افزار هوش مصنوعی واقعی است، اما دائمی نیست؛ و استنتاج، به‌خاطر ویژگی‌های بار کاری پیش‌بینی‌پذیرترش نسبت به آموزش، آسان‌ترین بخش برای جایگزینی با سیلیکون اختصاصی است. Jalapeño که اولین بار توسط TechCrunch گزارش شد، در حال حاضر در مرحله آزمایش به سر می‌برد و تاریخ استقرار تولیدی آن هنوز اعلام نشده است.