الحوسبة في وقت الاستدلال تعيد رسم اقتصاديات الذكاء الاصطناعي للمؤسسات

لطالما تم تصوير الذكاء الاصطناعي للمؤسسات على أنه سباق تدريب. كان يُفترض أن الجزء الصعب هو بناء نموذج قوي أو ترخيصه، وضبطه بدقة على البيانات الصحيحة، ثم وضع واجهة نظيفة فوقه. هذا الإطار يتقادم بسرعة. في عام 2026، السؤال الأكثر أهمية للعديد من الشركات ليس النموذج الذي دربوه، بل كمية الحوسبة التي يستهلكونها في كل مرة يقوم فيها النموذج بعمل مفيد بالفعل.
هذا التحول مهم لأن أنظمة الذكاء الاصطناعي الأكثر قيمة لم تعد مولدات نصوص أحادية اللقطة. إنها تتزايد لتصبح نماذج استدلال، ومساعدين يعتمدون بشكل كبير على الاسترجاع، ووكلاء متعددي الخطوات يستدعون الأدوات، ويقيمون المخرجات الوسيطة، ويعيدون محاولة المسارات الفاشلة، ويستمرون حتى ينهوا مهمة. كل ذلك يحدث في وقت الاستدلال. وهذا يعني أن اقتصاديات الذكاء الاصطناعي للمؤسسات يتم إعادة رسمها بتكلفة الحوسبة الحية، وزمن الاستجابة، والموثوقية، بدلاً من التدريب وحده.
نموذج تكلفة الذكاء الاصطناعي القديم كان بسيطًا جدًا
بالنسبة للموجة الأولى من تبني الذكاء الاصطناعي التوليدي، كانت الشركات تهتم بشكل أساسي بالوصول. أي مزود لديه أقوى نموذج؟ هل سيظل بائع API مستقرًا؟ هل يجب على الفريق ضبط نموذج بدقة أم مجرد كتابة مطالبات أفضل؟ تلك الأسئلة لا تزال مهمة، لكنها لا تفسر بشكل كامل سبب ارتفاع ميزانيات الذكاء الاصطناعي حتى مع انخفاض أسعار الرمز الواحد.
المشكلة هي أن سلوك المنتج قد تغير بشكل أسرع من عناوين التسعير. قد يولد طلب بسيط من روبوت الدردشة إجابة واحدة ويتوقف. غالبًا ما يقوم المساعد المؤسسي الجاد بأكثر من ذلك بكثير. قد يسحب مستندات داخلية عبر RAG، ويستدل على نافذة سياق طويلة، ويستدعي أداة بحث، وينتج مسودة، وينقد تلك المسودة، ويعيد كتابتها بتنسيق مختلف، ثم يوجه النتيجة إلى سير عمل آخر. على الورق، قد تبدو الإجابة النهائية كاستجابة واحدة. من حيث الحوسبة، يمكن أن تكون نتيجة لـ Pipeline صغير من القرارات.
جادلت ديلويت في أواخر عام 2025 بأن استدلال الذكاء الاصطناعي سيشكل ما يقرب من ثلثي إجمالي حوسبة الذكاء الاصطناعي في عام 2026، ارتفاعًا من حوالي الثلث في عام 2023. هذا ليس مجرد توقع للأجهزة. إنه توقع للمنتجات. إنه يعكس حقيقة أن الشركات تنتقل من تطوير النماذج نحو الاستخدام على نطاق واسع، والاستخدام هو حيث تظهر تكاليف التشغيل الحقيقية.
الاستدلال يغير اقتصاديات الوحدة
نماذج الاستدلال مهمة بشكل خاص هنا لأنها تكسر الافتراض الأنيق بأن الرموز الأرخص تعني تلقائيًا منتجات أرخص. قد يقدم النموذج الذي ينفق المزيد من الرموز في التفكير في مشكلة دقة أفضل، ولكنه يمكن أن يضاعف وقت التشغيل أيضًا. أضف خطوات التحقق أو استخدام الأدوات وتتوسع التكلفة مرة أخرى. بالنسبة لبعض أعباء العمل، هذا يستحق العناء تمامًا. بالنسبة للآخرين، فإنه يدمر الهوامش بهدوء.
هذا هو السبب في أن العديد من فرق الذكاء الاصطناعي أصبحت مهووسة بفكرة مستعارة من هندسة السحابة: ليس القدرة القصوى، بل التكلفة لكل مهمة ناجحة. قد يبرر سير عمل دعم العملاء الذي يحل قضية دون تصعيد ميزانية استدلال باهظة نسبيًا. ملخص المستندات الذي يستهلك نفس القدر من الحوسبة لتوفير 30 ثانية لشخص ما ربما لا يبرر ذلك. يريد المشتري المؤسسي بشكل متزايد إثباتًا بأن إنفاق الاستدلال يتوافق مع نتائج الأعمال، وليس فقط مع أداء المعايير.
استراتيجية البنية التحتية تتحول صعودًا وخارجًا
بمجرد أن يصبح الاستدلال مركز التكلفة المهيمن، تبدأ قرارات الهندسة المعمارية في الظهور بشكل مختلف. لا يزال اختيار النموذج مهمًا، لكن التنسيق أصبح أكثر أهمية مما كان عليه قبل عام. تهتم الفرق بالتخزين المؤقت، وضغط المطالبات، وتوجيه المهام منخفضة المخاطر إلى نماذج أصغر، وحجز نماذج الاستدلال الكبيرة للحالات التي يغير فيها التفكير الإضافي الإجابة بالفعل. يهتمون بالرصد (observability): أي المطالبات التي تطلق سلاسل طويلة، وأي الأدوات تفشل وتجبر على إعادة المحاولة، وأي المستأجرين يخلقون أسوأ ارتفاعات في التكلفة، وأي سير العمل دقيق بما يكفي لأتمتته بالكامل.
هذا هو أيضًا سبب اكتظاظ السوق فجأة بمنصات الاستدلال، وبوابات الذكاء الاصطناعي، وطبقات الحماية (guardrail layers)، وبيئات تشغيل سير العمل (workflow runtimes). إنها ليست مجرد برمجيات وسيطة تبحث عن مشكلة. إنها موجودة لأن الذكاء الاصطناعي للمؤسسات أصبح تخصصًا تشغيليًا. إذا كان التدريب قد حدد الفجوة التنافسية الأولى، فإن إدارة الاستدلال تحدد الفجوة التالية.
لماذا تستمر النماذج الأصغر في الحصول على أدوار أقوى
يساعد تحول الاستدلال أيضًا في تفسير الاهتمام المتجدد بالنماذج الصغيرة والمتوسطة. في العديد من بيئات المؤسسات، ليس النموذج الأذكى المتاح هو الخيار الأفضل للنشر تلقائيًا. يمكن أن يكون النموذج الأصغر الذي يعمل بشكل أسرع، ويكلف أقل، ويبقى ضمن ميزانية زمن استجابة يمكن التنبؤ بها أكثر قيمة إذا تعامل مع 80 بالمائة من الطلبات بشكل جيد بما فيه الكفاية. يصبح النموذج الكبير متخصصًا أو مسار تصعيد بدلاً من الافتراضي الشامل.
يبدو هذا النمط مألوفًا لأنه يشبه كيفية عمل أنظمة البرمجيات الناضجة. لا يصل كل طلب إلى أغلى طبقة قاعدة بيانات. لا يتطلب كل إجراء للمستخدم أعمق Pipeline تحليلي. بدأت منتجات الذكاء الاصطناعي في تبني تسلسل هرمي مماثل. تتعامل النماذج السريعة مع الفرز والتصنيف والاستخراج والصياغة. تتدخل أنظمة الاستدلال الأكبر حيث تبرر الغموض أو المخاطر القانونية أو تأثير الإيرادات الإنفاق.
صراع الميزانية الخفي
هناك أيضًا تبعات سياسية داخلية لكل هذا. غالبًا ما تتم الموافقة على ميزانيات التدريب كرهانات استراتيجية. تظهر ميزانيات الاستدلال كنفقات تشغيلية متكررة. تتسامح فرق المالية مع دفعة ابتكار لمرة واحدة بسهولة أكبر من فاتورة شهرية مفتوحة. وهذا يعني أن قادة الذكاء الاصطناعي يحتاجون بشكل متزايد إلى شرح أنظمتهم بنفس الطريقة التي يشرح بها مشغلو SaaS إنفاق السحابة: ببيانات الاستخدام، ومستويات الخدمة، وحجة واضحة حول أين تذهب الأموال.
الشركات التي تتجاهل هذا ستنتهي بمطابقة غير ملائمة. سوف يعلنون عن الذكاء الاصطناعي عبر المنتج، ثم يحدون من معدله بهدوء، ويخفون أفضل الميزات وراء خطط مميزة، أو يكتشفون أن عملائهم الأكثر تفاعلاً هم الأقل ربحية. هذه ليست قضية نظرية. إنها النتيجة الطبيعية لتحويل الفكر إلى بنية تحتية مقاسة.
ماذا يجب أن تفعله فرق المؤسسات بعد ذلك
الدرس العملي ليس التوقف عن استخدام النماذج المتقدمة. بل هو التصميم لذكاء انتقائي. قس نجاح مستوى المهمة بدلاً من حجم الرموز وحده. حدد ملامح سير العمل الأكثر تكلفة. افصل المسارات الثقيلة بالاستدلال عن المسارات الروتينية. قم بتجهيز كل استدعاء أداة. قرر أين يكون زمن الاستجابة أكثر أهمية من الإجابات المثالية وأين تستحق الدقة حوسبة أعمق. الأهم من ذلك كله، توقف عن التعامل مع الاستدلال كبند سلعي.
هذه هي نقطة التحول الحقيقية. التدريب جعل الذكاء الاصطناعي مثيرًا للإعجاب. الاستدلال هو ما يجعله عملًا تجاريًا. الشركات التي تفهم هذا مبكرًا لن تشتري نماذج أفضل فحسب. بل ستبني هياكل تكلفة أفضل، وحدود منتجات أفضل، وانضباطًا تشغيليًا أفضل حول أنظمة الذكاء الاصطناعي التي تحتاج إلى العمل طوال اليوم، كل يوم، على نطاق واسع.