نماذج الذكاء الاصطناعي يمكنها الآن قراءة قاعدة الأكواد بأكملها. إليك ما يغيّره ذلك فعلياً.

أصبحت نافذة السياق (Context Window) ساحة المعركة التقنية المحددة للدورة الحالية للذكاء الاصطناعي. في ثمانية عشر شهراً، ارتفع السقف العملي للنماذج القائمة على Transformer من 128 ألف توكن إلى أكثر من مليون توكن – ومع Gemini 2.5 Pro، إلى 2 مليون توكن. يُقدَّم هذا الرقم عادةً كمواصفات للمنتج. لكنه يستحق نظرة أعمق.

التوكن يمثل تقريباً ثلاثة أرباع الكلمة. مليون توكن يعادل حوالي 750,000 كلمة – أي ما يعادل عشر روايات متوسطة، أو وثيقة قانونية من 2000 صفحة، أو معظم قاعدة الأكواد لشركة برمجيات متوسطة الحجم. عندما يستطيع النموذج الاحتفاظ بكل هذا في سياق عمله في وقت واحد، فإن أنواع الأسئلة التي يمكنك طرحها عليه تتغير جوهرياً.

من مقتطف إلى نظام

كانت حالة الاستخدام الأصلية لمساعدي الأكواد هي الإكمال التلقائي: اكتب اسم دالة، واحصل على بضعة أسطر من استمرار معقول. هذا لا يزال يعمل بشكل جيد. لكن التحول المثير يحدث عندما يكون لدى النموذج إمكانية الوصول إلى النظام بأكمله – كل ملف، كل استيراد، كل عقد واجهة (Interface Contract).

يدعم Claude Opus 4.8 من Anthropic مليون توكن بدقة استرجاع قوية عبر النافذة بأكملها – وهي مشكلة كانت تعاني منها محاولات السياق الطويل السابقة. ويصل Gemini 2.5 Pro من Google إلى 2 مليون توكن. بينما يستقر GPT-4.1 من OpenAI عند مليون توكن. لم يعد السباق يدور حول ما إذا كان بإمكانك قراءة مستند كبير – بل حول ما إذا كان النموذج قادراً على التصرف بشكل متماسك بناءً على ما قرأه.

لتطوير البرمجيات، هذا يعني شيئاً ملموساً: النموذج الذي قرأ وحدة المصادقة (Authentication Module) الخاصة بك، ومخطط قاعدة البيانات (Database Schema) الخاص بك، وطبقة API الخاصة بك، ومجموعة الاختبارات (Test Suite) الخاصة بك في وقت واحد، يعمل من نفس الصورة الكاملة التي يحملها مهندس أول في رأسه. عندما يقترح إعادة هيكلة (Refactor)، يمكنه رؤية نطاق التأثير. عندما يجد خطأ (Bug)، يمكنه تتبعه عبر ثلاث طبقات من التجريد.

ما يتحسن فعلياً

أكثر المكاسب موثوقية من السياق الطويل هي في المهام الكامنة بطبيعتها: تحليل التبعيات، تدقيق الأمان، مراجعة البنية، إعادة الهيكلة عبر الملفات. هذه المهام هي التي كان التحليل التجزئي فيها دائماً هو العنق الزجاجة، وليس قدرة النموذج على الاستدلال.

مهام الاسترجاع تتحسن أيضاً من الناحية النوعية. اعتمدت الأساليب السابقة لتحليل المستندات الكبيرة على RAG – تقسيم المستندات، Embedding لها، واسترجاع الأجزاء ذات الصلة في وقت الاستعلام. RAG هو حل مؤقت للسياق المحدود، ويُدخل فجوات: قد لا يعيد المسترجع الجزء الصحيح، قد يفوت Embedding العلاقات الدلالية، النموذج لا يرى أبداً قطعتين من الأدلة كانتا ستجعلان الارتباط واضحاً. السياق الكامل للمستند يزيل هذه الفجوات للمستندات التي تناسب النافذة.

يتم بالفعل إعادة بناء مسارات العمل القانونية والمالية حول هذه القدرة. النموذج الذي يقرأ اتفاقية استحواذ كاملة – مع جميع الجداول والملاحق – يمكنه الإجابة على أسئلة الإسناد الترافقي التي كانت تتطلب من محامٍ ربط البنود يدوياً. النموذج لا يحل محل المحامي، لكنه يلغي خطوة الاسترجاع التي كانت تستهلك معظم الوقت القابل للفوترة.

مشكلة تخفيف الانتباه (Attention Dilution)

المكاسب ليست موحدة. وثقت عدة تقييمات مستقلة نمط فشل ثابت في نماذج السياق الطويل: يتدهور الأداء عندما تكون المعلومات ذات الصلة مدفونة في عمق منتصف نافذة السياق. هذه الظاهرة لها اسم في أدبيات الأبحاث: مشكلة "الضائع في الوسط" (Lost in the Middle).

قامت Google و Anthropic باستثمارات معمارية صريحة لمعالجة هذا – يستخدم Gemini 2.5 تشفيرات موضعية مُتعلمة (Learned Positional Encodings) مصممة للاسترجاع الطويل المدى، بينما تبلغ Anthropic عن تحسن في انتظام الاسترجاع في سلسلة Claude 4.x. لكن لم تنشر أي من الشركتين تقييمات كاملة من نوع "الإبرة في كومة قش" (Needle-in-a-Haystack) عند مليون توكن للجمهور للتحقق منها بشكل مستقل.

هناك أيضاً مسألة التكلفة. يعني توسيع نطاق ميزانية التوكن أن استدعاء مليون توكن أغلى بكثير من استدعاء 100 ألف توكن. في الممارسة العملية، تقلل توكنات المطالبة المخبَّأة (Cached Prompt Tokens) من ذلك – يقلل التخزين المؤقت للمطالبة من Anthropic تكاليف السياق بنسبة 90% للاستدعاءات المتكررة، مما يجعل نافذة المليون توكن قابلة للتطبيق للتطبيقات التي تعيد استخدام السياقات الكبيرة عبر استعلامات متعددة.

أين لا يزال غير كافٍ

يظل الفيديو هو الحدود. يحتوي فيديو مدته ساعة واحدة بمعدل 24 إطاراً في الثانية على 86,400 إطار. يعمل فهم الفيديو الأصلي على إدخال مُختزَل – يتعامل Gemini 1.5 Pro مع إطار واحد في الثانية مع معالجة صوتية منفصلة. لتحليل المراقبة أو مراجعة الفيديو الطويلة، يفقد هذا الضغط الكثير من المعلومات.

الحد الثاني هو الذاكرة النشطة. نافذة السياق ثابتة – إنها ما حمله النموذج في بداية المحادثة. للتطبيقات التي تحتاج إلى تتبع الحالة المتطورة عبر جلسات عديدة، تُكمَّل نوافذ السياق ولكن لا تُستبدَل بأنظمة الذاكرة الخارجية: قواعد البيانات، مخازن المتجهات، البنى المعزَّزة بالذاكرة.

ماذا يعني هذا للمطورين الآن

هناك ثلاثة أشياء تستحق القيام بها بشكل مختلف الآن بعد أن أصبحت نوافذ السياق بحجم مليون توكن جاهزة للإنتاج:

توقف عن التقسيم المفرط لخطوط أنابيب RAG الخاصة بك. للمستندات التي تقل عن 500 صفحة، سيتفوق سياق المستند الكامل على الأساليب المعزَّزة بالاسترجاع في المهام الدقيقة. قم ببناء خط أنابيب RAG للتوسع عبر مستندات متعددة، وليس للتعويض عن حجم المستند.

استخدم نافذة السياق لمراجعة الكود على مستوى النظام قبل فتح PR. تغذية فرع ميزة كامل – جميع الملفات التي تم تغييرها، الـ Diff، ملفات الاختبار ذات الصلة – لاستدعاء نموذج واحد مع طلب مراجعة منظم يلتقط المشكلات عبر الملفات التي تفوتها مراجعة كل ملف على حدة حسب التصميم.

أعد النظر في الافتراضات حول ما يتطلب Fine-tuning. العديد من المهام التي قام الناس بـ Fine-tuning عليها – تلخيص المستندات، مطابقة الأسلوب، استخراج الكيانات من المجموعات المتخصصة – يمكن الآن التعامل معها في السياق مع الأمثلة والوصول الكامل للمستند. لا يزال Fine-tuning متفوقاً للاستدلال الحساس لزمن الوصول والتوزيعات التدريبية المحدودة، لكنه لم يعد الخيار الأول.

نافذة السياق لا تزال تتوسع. الأسئلة التي تستحق الطرح لم تعد تتعلق بالسقف – إنها تتعلق بما تبنيه عندما لا يكون ذلك السقف هو القيد بعد الآن.