تجميع ذاكرة CXL ينتقل من شريحة خارطة الطريق إلى خيار تصميم في مراكز البيانات

لفترة طويلة، بدا Compute Express Link وكأنه إحدى تقنيات مراكز البيانات التي يتفق الجميع على أهميتها في المستقبل. كان يظهر في الخطب الرئيسية ومخططات الهندسة وخارطة الطريق حول البنية التحتية القابلة للتجميع، لكن معظم المشغلين كانوا لا يزالون يشترون الخوادم بالطريقة القديمة: مقابس CPU ثابتة، ذاكرة محلية ثابتة، افتراضات ترقية ثابتة. هذا بدأ يتغير. مع كشف أعباء عمل الذكاء الاصطناعي عن تكلفة الذاكرة المعلقة وحدود تصميم الخوادم الصلبة، ينتقل توسيع ذاكرة CXL وتجميعها من النظرية إلى مناقشات الشراء.
السبب بسيط. أصبحت البنية التحتية الحديثة غير متوازنة. بعض أعباء العمل تحتاج إلى قدرة حاسوبية عالية، وبعضها يحتاج إلى ذاكرة كبيرة، والكثير منها يحتاج إلى كليهما في أوقات مختلفة من اليوم. ومع ذلك، تجبر الخوادم التقليدية المشترين على توفير CPU و DRAM معًا بخطوات خشنة نوعًا ما. هذا يخلق هدرًا. غالبًا ما تدفع الفرق مقابل سعة ذاكرة محلية تظل غير مستغلة على عقدة بينما يكون عبء العمل المجاور مقيدًا. CXL جذابة لأنها تعد بعلاقة أكثر مرونة بين المعالجات والذاكرة، خاصة في البيئات التي يخلق فيها استدلال الذكاء الاصطناعي والتحليلات والمحاكاة الافتراضية منحنيات طلب غير متوقعة.
ما الذي تغيره CXL مقارنة بذاكرة الخادم التقليدية
على مستوى عالٍ، توسع CXL أفكار الربط عالي السرعة بحيث يمكن لوحدات CPU ومسرعات وأجهزة الذاكرة مشاركة البيانات بشكل أكثر تماسكًا مما سمحت به نماذج الربط القديمة. بالنسبة لمشتري البنية التحتية، النقطة العملية ليست أناقة البروتوكول. إنها المرونة. بدلاً من معاملة ذاكرة الخادم كشيء ملحوم بشكل دائم بهوية العقدة، يمكن للمشغلين البدء في التفكير في الذاكرة كمورد يمكن توسيعه أو تقسيمه طبقيًا أو في بعض الحالات تجميعه بشكل أكثر مرونة.
هذا لا يعني أن كل رف يصبح فجأة نسيج ذاكرة مثالي. زمن الوصول لا يزال مهمًا، والبرمجيات لا تزال بحاجة إلى فهم الطبولوجيا، و DDR المحلي يظل الإجابة الصحيحة للعديد من أعباء العمل ذات المسار الساخن. لكن CXL تغير القائمة. يمكن لفريق المنصة أن يسأل ما إذا كان عبء العمل يحتاج حقًا إلى كل ذاكرة DRAM عالية الأداء محليًا لوحدة CPU، أم أن بعض السعة يمكن أن تكون خلف طبقة متصلة بـ CXL مع مقايضات أداء مقبولة. هذا السؤال لم يكن عمليًا في تخطيط الخوادم الرئيسي قبل بضع سنوات.
الذكاء الاصطناعي يجعل الذاكرة المعلقة أكثر صعوبة في تبريرها
البنية التحتية للذكاء الاصطناعي هي سبب رئيسي لظهور CXL الآن بدلاً من لاحقًا. مجموعات التدريب تحصل على معظم العناوين، لكن الضغط التشغيلي الأوسع يدور حول الاستدلال، وأعباء العمل المتجهة، وخطوط أنابيب إعداد البيانات التي تحتاج إلى مجموعات عمل كبيرة وسريعة دون استخدام متوازن لوحدات CPU و GPU والذاكرة دائمًا. في تلك البيئات، تصبح الذاكرة المعلقة مؤلمة ماليًا. المشغلون قلقون بالفعل حول المسرعات غير المستغلة. بدأوا الآن يلاحظون ذاكرة DRAM غير المستغلة وتكلفة ترقيتها بشكل متزامن مع كل مكون آخر.
CXL تقدم طريقة لتخفيف تلك الصلابة. بطاقات توسيع الذاكرة يمكن أن تضيف سعة دون الحاجة إلى إعادة تصميم كاملة للمنصة. بنية التبديل والتجميع تخلق إمكانية تخصيص الذاكرة بشكل أكثر ديناميكية عبر الأنظمة. حتى عندما لا يتم نشر التجميع الكامل فورًا، فإن وجود مسار توسع قائم على المعايير يغير محادثة الشراء. يمكن للمشترين التخطيط لنمو الذاكرة بشكل تدريجي بدلاً من الرهانات الكلية في وقت شراء الخادم.
لماذا هذه أيضًا قصة تكلفة وعمليات
من السهل وصف CXL كتقنية أداء، لكن جاذبيتها الكبيرة اقتصادية. فرق مراكز البيانات تحت ضغط من ميزانيات الذكاء الاصطناعي، وقيود الطاقة، وتقلب المشتريات. إذا استطاعت شركة تأجيل بعض دورات استبدال الخادم، أو تحسين متوسط استخدام الذاكرة، أو تقليل الإفراط في التجهيز للسيناريوهات القصوى، فهذا مهم. البنية التحتية القابلة للتجميع تبدو مجردة حتى تظهر ككثافة رأس مال أقل لكل عبء عمل أو مسار أنظف لامتصاص طفرات الطلب.
هناك أيضًا زاوية عملياتية. التصميم الثابت للخادم يجبر الفرق على حل كل مشكلة نمو بنوع عقدة آخر، ومسار تأهيل آخر، واستثناء دورة حياة آخر. CXL لا تزيل هذا التعقيد، لكنها يمكن أن تقلل من عدد المرات التي تضطر فيها فرق البنية التحتية للاختيار بين شراء الكثير اليوم أو المخاطرة بنقص غدًا. هذا مهم في البيئات التي يكون فيها توحيد الأسطول مهمًا تقريبًا مثل أداء المعيار الخام.
المشكلة أن الطبولوجيا لا تزال تتحكم في كل شيء
لا يعني أي من هذا أن CXL وجبة مجانية. السؤال الصعب هو أين تنتمي في التسلسل الهرمي. الذاكرة المحلية لا تزال الأفضل لمجموعات العمل الأكثر سخونة. الذاكرة المتصلة بـ CXL يمكن أن تكون مفيدة للغاية، لكن فقط عندما يتوافق عبء العمل ومكدس البرمجيات وتحمل زمن الوصول. بعض الفرق سوف تبالغ في تقدير مدى شفافية التجميع. البعض الآخر سيكتشف أن تنسيقهم أو مراقبتهم أو ضبط تطبيقاتهم ليس جاهزًا لمعاملة الذاكرة كمورد مشترك أكثر ديناميكية.
لهذا السبب، يقترب المشغلون الأذكياء من CXL كخيار تصميم، وليس كدين. هم يرسمون أعباء العمل حسب الحساسية، وليس افتراض أن كل خادم يجب أن يصبح قابلاً للتجميع بالكامل بين ليلة وضحاها. هم يسألون أين يساعد التوسع فورًا، وأين يمكن أن يحقق التقسيم الطبقي وفورات حقيقية، وأين يبقى التجميع خيارًا استراتيجيًا أكثر من كونه افتراضيًا تشغيليًا. هذا النهج المتوازن أكثر صحة من كلا النقيضين: رفض CXL كضجة أو التظاهر بأنها تحل محل الهندسة التقليدية فورًا.
البائعون الآن عليهم إثبات أكثر من مجرد الامتثال للمعايير
التمييز الناشئ ليس فقط من يدعم CXL على ورقة المواصفات. إنه من يجعلها قابلة للنشر. المشترون بحاجة إلى طبولوجيات معتمدة، وأدوات إدارة، وضوابط أمنية، وقياس عن بعد، وإرشادات واقعية حول سلوك الأداء تحت التنافس. يحتاجون إلى معرفة ما يحدث عندما تصبح الذاكرة المشتركة مشكلة جار مزعج، أو عندما تتفاعل طبقات التوسع مع المحاكاة الافتراضية وأطر التسرع. المعايير تخلق الفتحة، لكن تنفيذ المنتج يقرر ما إذا كان المشغل سيثق في النشر.
هنا ستحدث الجولة التالية من المنافسة. مصنعو الخوادم، وبائعو المحولات، وشركات السيليكون، ومقدمو برمجيات المنصة، جميعهم يريدون امتلاك جزء من قصة البنية التحتية القابلة للتجميع. البائعون الذين سيفوزون لن يكونوا أولئك الذين يتحدثون بصوت أعلى عن مستقبل أقمشة الذاكرة. سيكونون أولئك الذين يجعلون CXL مفهومة بما يكفي لفرق البنية التحتية لنمذجتها واختبارها ودعمها دون بطولات.
ما الذي يجب على فرق البنية التحتية متابعته
السؤال القصير الأمد ليس ما إذا كان يجب على كل مؤسسة بناء نسيج ذاكرة مجمّع. إنه ما إذا كانت CXL تسمح لأساطيل معينة بأن تصبح أسهل في التحجيم وأرخص في التطور. يجب على الفرق فحص مجموعات استدلال الذكاء الاصطناعي، وبيئات التحليلات، وأعباء العمل الافتراضية حيث يكون ضغط الذاكرة مرتفعًا ولكن غير متزامن تمامًا عبر العقد. يجب عليهم مقارنة تكلفة ذاكرة DRAM المحلية المفرطة في التجهيز مع التعقيد التشغيلي للتوسع أو التجميع. يجب عليهم أيضًا الانتباه إلى جاهزية البرمجيات، لأن مرونة الذاكرة مفيدة فقط إذا كان بإمكان المجدولين والتطبيقات استغلالها.
CXL تصبح مثيرة للاهتمام لنفس السبب الذي يجعل العديد من تقنيات البنية التحتية مهمة في النهاية: ليس لأن البروتوكول نفسه جذاب، ولكن لأن تصميم النظام الصلب يصبح أكثر تكلفة. مركز البيانات يدخل عصرًا حيث لم يعد من الممكن معاملة الذاكرة كملحق سلبي لقرارات CPU. CXL لن تحل كل مشكلة أداء، لكنها أخيرًا أصبحت خيار تصميم حقيقي، وهذا وحده كافٍ لإعادة تشكيل كيفية تخطيط أساطيل الخوادم الحديثة.