Grep تضيف وكيل LLM إلى Monito مع تحول مراقبة الاختبارات نحو مراجعة السياق

بقلممكتب الذكاء الاصطناعي والمؤسسات في SendTech Timesتغطية مكتبية محررة ومراجعة المصدر|المصدر: Aitimes

موجز التحرير

قالت Grep إن منتج Monito لمراقبة الاختبارات عبر الإنترنت يستخدم الآن وكيل LLM لتحليل السياق حول الأحداث المشتبه بها. وذكرت الشركة اختبارات داخلية أظهرت تقليص وقت المراجعة بعد الاختبار بأكثر من 30% وخفض التنبيهات الخاطئة بنحو 20%. وتبقى القضية الرئيسية هي ما إذا كانت المراقبة المعتمدة على الوكلاء تستطيع تحسين الكفاءة مع الحفاظ على الحكم البشري النهائي وعدالة المرشحين.

تمت المراجعة مقابل مواد المصدرتحرير مكتب الذكاء الاصطناعي والمؤسسات في SendTech Times

Grep تضيف وكيل LLM إلى Monito مع تحول مراقبة الاختبارات نحو مراجعة السياق

مصدر الصورة: AI타임스

Grep تنقل مراقبة الاختبارات من الرصد إلى فهم السياق

قالت Grep إنها أضافت نظام وكلاء إلى Monito، منتجها لمراقبة الاختبارات عبر الإنترنت، بهدف تحسين دقة رصد حالات الاشتباه في الغش.

يعتمد المنتج بالفعل على وظائف مدعومة بالذكاء الاصطناعي مثل تتبع النظر، وتوثيق الوجه، ومنع نسخ الشاشة واستخدام شاشة مزدوجة، إضافة إلى مراقبة فورية بثلاث قنوات عبر كاميرا الويب والهاتف المحمول ومشاركة الشاشة. وذكر المصدر أن Monito أثبت توفيراً في تكاليف التشغيل يصل إلى 40% مقارنة بالمراقبة الحضورية.

الإشارة الجديدة هي الانتقال من رصد الأحداث البسيطة إلى تحليل السياق. وقالت Grep إن الأنظمة السابقة كانت تعتمد على تنبيهات مادية مثل خروج اليد من نطاق الشاشة، ما حد من الدقة. وأدخلت الشركة الآن وكيل LLM يراجع السياق المحيط بدلاً من الحكم على فعل واحد بمعزل عن غيره.

لماذا يهم ذلك

بالنسبة إلى مزودي تقنيات التعليم وفرق الاختبارات المؤسسية ومشغلي الشهادات، يشير الإعلان إلى حالة استخدام عملية لوكلاء الذكاء الاصطناعي: تقليل عبء المراجعة مع إبقاء الإنسان في حلقة القرار النهائي.

وقالت Grep إن الميزات الرئيسية تشمل ملخصات موقف تضيف سياقاً إلى نتائج رصد الذكاء الاصطناعي، ودرجة للغش تتيح للمشرفين فحص المرشحين الأعلى خطراً أولاً، والتنقل السريع إلى مقطع الفيديو ذي الصلة عند العثور على نشاط مشبوه. وقالت الشركة إن الوكيل يستطيع تلخيص الحالات المشتبه بها وسياقها في تقارير سردية، ما يسمح للمراقبين البشريين بمراجعة الحالات التي اختارها الذكاء الاصطناعي بدلاً من مراقبة كل الفيديو في الوقت الفعلي.

وبحسب اختبارات داخلية وردت في المصدر، قلل النهج وقت المراجعة بعد الاختبار بأكثر من 30% مقارنة بفحص تسجيلات الفيديو كاملة. وتظهر لوحة وكيل الذكاء الاصطناعي الجديدة في الجانب الأيمن من شاشة المشرف وتقدم نتائج التحليل في الوقت الفعلي.

المراجعة البشرية تبقى أساسية

يحرص المصدر على عرض الذكاء الاصطناعي كمساعد وليس كحكم نهائي. فقد أكدت Grep أن الذكاء الاصطناعي لا يتخذ القرار النهائي بشأن الغش. إنه يختار الظروف المشتبه بها ويبلغ عنها، بينما يجب أن يتخذ مشرف بشري القرار النهائي ضمن بنية الإنسان في الحلقة.

هذا التمييز مهم لأن أنظمة مراقبة الاختبارات تؤثر في عدالة الاختبار وثقة المرشحين. وقالت Grep إن النظام صمم بحيث لا يتضرر المتقدمون بحسن نية حتى إذا أنتج الذكاء الاصطناعي إنذاراً خاطئاً. وأظهرت الاختبارات الداخلية أيضاً أن التنبيهات الخاطئة انخفضت بنحو 20%.

ما يجب متابعته

ينبغي متابعة ما إذا كانت Grep تستطيع تحويل طبقة الوكيل إلى تحسينات موثوقة قابلة للقياس خارج الاختبارات الداخلية. وقالت الشركة إن جمع البيانات واستخدامها لتدريب نماذج الذكاء الاصطناعي يلتزمان بقانون حماية المعلومات الشخصية والقواعد ذات الصلة، مع إزالة تعريف بيانات الفيديو بحيث لا يمكن التعرف على الوجوه والمعلومات الشخصية الحساسة الأخرى.

مجال التطوير التالي هو مراقبة الاختبارات بالذكاء الاصطناعي متعدد الوسائط. وتخطط Grep لتطوير تقنية تدمج الفيديو والصوت وسجلات البيئة، ولتطوير الوكيل بحيث يحلل بيانات سلوكية إضافية مثل مسارات حركة الفأرة وأنماط الكتابة على لوحة المفاتيح.

#Grep #Monito #وكلاء_الذكاء_الاصطناعي #ذكاء_اصطناعي_كوري

مقالات ذات صلة

المزيد

الذكاء الاصطناعي

Builderbot من Block يُظهر أين تصطدم أدوات البرمجة بالذكاء الاصطناعي بجدار المؤسسات

تقول Block إن إطار العمل Builderbot ينسّق عمل وكلاء الذكاء الاصطناعي عبر المستودعات الداخلية، وخيوط Slack، ومتتبعات المشكلات، وسير عمل التكامل المستمر. وتقول الشركة إن النظام ينفّذ أكثر من 200,000 أمر يوميًا، ويدمج نحو 1,500 طلب سحب أسبوعيًا، ويمثل ما يقرب من خمسة عشر بالمئة من تغييرات الشيفرة في الشركة. لكن الادعاء الأقوى لا يتعلق بتوليد الشيفرة وحده. فشركة Block تختبر ما إذا كان العمل البرمجي القائم على الوكلاء يمكنه التعامل مع الأذونات، والسياق، وإخفاقات CI، وعزل بيانات العملاء داخل مؤسسة هندسية كبيرة.

الذكاء الاصطناعي

OpenAI تطلق GPT-Live لـ ChatGPT Voice دون موعد API

قالت OpenAI إن GPT-Live سيجعل ChatGPT Voice قادرا على الاستماع والتحدث في الوقت نفسه، مع تولي GPT-5.5 مهام البحث والاستدلال الأصعب في الخلفية. وأشارت الشركة إلى أكثر من 150 مليون مستخدم أسبوعيا لـ Voice وDictation لكنها لم تحدد موعد API أو تواريخ دعم الفيديو أو تحقق benchmark مستقلا.

الذكاء الاصطناعي

تقييم Cognition AI البالغ 26 مليار دولار يختبر جدوى وكلاء البرمجة للشركات

جمعت Cognition AI، المطورة لوكيل البرمجة Devin، أكثر من مليار دولار بتقييم يبلغ 26 مليار دولار، وفقاً لـ TMTPost. ويعكس التمويل رهانات كبيرة على وكلاء البرمجة داخل الشركات، مع استمرار أسئلة الموثوقية والمنافسة.

الذكاء الاصطناعي

جولة كورالوجيكس البالغة 200 مليون دولار تضع مراقبة وكلاء الذكاء الاصطناعي تحت أنظار المؤسسات

جمعت كورالوجيكس 200 مليون دولار في تمويل من السلسلة F لتوسيع أدوات مراقبة البرمجيات المرتبطة بعمليات وكلاء الذكاء الاصطناعي. قيّمت الجولة الشركة عند 1.6 مليار دولار بعد الاستثمار، ورفعت إجمالي رأس المال الذي جمعته إلى 550 مليون دولار. الاختبار العملي هو ما إذا كان استخدام المؤسسات لوكلاء الذكاء الاصطناعي سيحوّل الإنفاق على المراقبة التشغيلية إلى نمو مستدام لكورالوجيكس.

الذكاء الاصطناعي

OpenAI تبقي نموذج GPT-Red الهجومي خاصا بعد اختبارات prompt injection

أفاد The Next Web بأن OpenAI بنت GPT-Red، وهو نموذج داخلي للاختبار الهجومي الآلي لهجمات prompt injection، لكنها تبقي أداة الهجوم خاصة. وذكر التقرير نسب نجاح تجاوزت 90% ضد نسخة أقدم من GPT-5 وأقل من 23% ضد GPT-5.6، مع بقاء حالات يلتقطها المختبرون البشر.

الذكاء الاصطناعي

OpenAI تضيف تحليلات استخدام وضوابط إنفاق إلى ChatGPT Work

قالت OpenAI إن GPT-5.6 يستخدم رموز إخراج أقل بنسبة 54% ووقتا أقل بنسبة 57% لكل مهمة في مؤشر وكيل برمجي مسمى، بينما تطلب إرشاداتها للمؤسسات من مسؤولي ChatGPT Work إدارة إنفاق الذكاء الاصطناعي عبر النتائج المقبولة وتحليلات الاستخدام وضوابط الحوكمة بدلا من سعر الرمز وحده.