Z.ai تدفع GLM-5.2 بنماذج البرمجة المفتوحة إلى مسارات عمل أطول
أطلقت Z.ai نموذج GLM-5.2 بترخيص MIT ونافذة سياق من مليون رمز، مع مؤشرات أداء لوكلاء البرمجة وخيارات تشغيل ذاتي، ما يعيد هندسة البرمجيات طويلة السياق إلى سباق النماذج المفتوحة.

Z.ai تطلق GLM-5.2 لوكلاء البرمجة
أطلقت Z.ai نموذج GLM-5.2، وهو نموذج ذكاء اصطناعي مفتوح المصدر يستهدف وكلاء البرمجة الذين يحتاجون إلى العمل عبر مستودعات كبيرة ووثائق ومخرجات أدوات وتاريخ مهام طويل.
يتاح النموذج بترخيص MIT ويدعم نافذة سياق من مليون رمز. وتضع Z.ai هذه السعة لاستخدامات هندسة برمجيات على مستوى المشروع، لا لمجرد المطالبات الطويلة، مع حالات استخدام تشمل تنفيذات كبيرة وبحثاً آلياً وتحسين الأداء وتصحيح أخطاء معقداً.
يتبع الإصدار نموذج GLM-5.1 ويضيف مستويات متعددة لجهد التفكير. وتتيح أوضاع High وMax للمستخدمين الاختيار بين استجابات أسرع ومعالجة أكثر كثافة حسابياً عندما تحتاج المهام إلى استدلال أطول.
المؤشرات تركز على هندسة سطر الأوامر
يعطي جدول مؤشرات Z.ai ادعاءً ملموساً للمطورين. في SWE-bench Pro، تدرج الشركة GLM-5.2 عند 62.1، ارتفاعاً من 58.4 لنموذج GLM-5.1. وفي Terminal-Bench 2.1، تدرج GLM-5.2 عند 81.0، مقارنة مع 62.0 للنموذج السابق.
نتيجة Terminal-Bench 2.1 هي القفزة الأكبر لأن هذا المؤشر يختبر مهام هندسة برمجيات عبر سطر الأوامر. كما أدرجت Z.ai أفضل نتيجة harness معلنة عند 82.7 لنموذج GLM-5.2، وقالت إن النموذج قريب من نتيجة Claude Opus 4.8 البالغة 85.0 على المؤشر نفسه، لكنه لا يزال دونها.
هذه الأرقام نتائج منشورة من الشركة، وليست دليلاً على موثوقية إنتاجية. لكنها توضح أين تريد Z.ai أن يقيّم المطورون النموذج: مسارات برمجة تحتاج إلى ملفات وأوامر واختبارات ومخرجات أدوات تبقى ضمن السياق خلال مهمة أطول.
السياق الطويل يخلق مشكلة تكلفة أيضاً
ربطت الشركة GLM-5.2 كذلك بتشغيل أقل تكلفة للسياق الطويل. وقالت Z.ai إن IndexShare يعيد استخدام المفهرس نفسه عبر مجموعات من طبقات الانتباه المتناثر ويخفض FLOPs لكل رمز بمقدار 2.9 مرة عند طول سياق يبلغ مليون رمز.
وقالت Z.ai أيضاً إن تغييرات طبقة التنبؤ متعددة الرموز زادت طول القبول في فك الترميز التخميني بما يصل إلى 20%. وتهم هذه الادعاءات لأن وكلاء البرمجة طويلة السياق يمكن أن يصبحوا مكلفين عندما تتراكم سجلات الاختبار ومخرجات الأوامر وملفات المستودع داخل تاريخ المهمة.
يمكن تشغيل النموذج عبر أدوات مدرجة في وثائق Hugging Face، بما في ذلك Transformers وvLLM وSGLang وDocker Model Runner وKTransformers. كما تدرج الوثائق خيارات نشر Ascend NPU عبر vLLM-Ascend وxLLM وSGLang.
التشغيل الذاتي ينقل المسؤولية إلى المطورين
يمنح الإصدار المرخص بترخيص MIT مطوري المؤسسات وفرق الذكاء الاصطناعي طريقاً لتشغيل النموذج على بنية يسيطرون عليها، بدلاً من الاعتماد فقط على وصول مستضاف إلى نموذج مغلق. ويمكن أن يساعد ذلك الفرق التي تحتاج إلى سيطرة على النشر وحدود معالجة البيانات.
لكنه ينقل عبئاً تشغيلياً أكبر إلى المستخدم. فالفرق التي تشغل GLM-5.2 ذاتياً لا تزال مطالبة بإدارة البنية والتوليف والتقييم والأمان حول وكيل البرمجة الذي يستخدمه.
تشير تعليقات مبكرة من Guillermo Rauch الرئيس التنفيذي لـVercel، ومن Matt Velloso المدير السابق في Meta وGoogle DeepMind وMicrosoft، إلى اهتمام المطورين، لكن Z.ai لم تحول تلك التفاعلات إلى دليل إنتاجي واسع. لدى GLM-5.2 الآن ادعاءات مؤشرات وخيارات نشر مدعومة بالنص الأصلي؛ والمسألة غير المحسومة هي ما إذا كانت الفرق المستقلة تستطيع إعادة إنتاج نتائج موثوقة في مسارات هندسية حقيقية.
















