Patronus AI تجمع 50 مليون دولار مع انتقال اختبارات الوكلاء بعد المعايير
جمعت Patronus AI جولة Series B بقيمة 50 مليون دولار لبناء بيئات رقمية محاكاة لاختبار وكلاء الذكاء الاصطناعي، لكن أدلتها ما زالت تتركز على نمو الإيرادات وطلب العملاء لا على إثبات واسع لقدرة الوكلاء على تشغيل مهام طويلة بثبات.

Patronus تبيع اختبار الوكلاء بعد المعايير
جمعت Patronus AI جولة Series B بقيمة 50 مليون دولار لبرمجيات تختبر وكلاء الذكاء الاصطناعي داخل بيئات رقمية محاكاة، في إشارة إلى أن موثوقية الوكلاء أصبحت بند إنفاق لدى مختبرات النماذج والشركات التي تبني سير عمل مؤتمتا.
تأسست الشركة الناشئة في San Francisco عام 2023 على يد Anand Kannappan وRebecca Qian، وهما باحثان سابقان في Meta AI. قادت Greenfield Partners الجولة الجديدة، مع مشاركة Notable Capital وLightspeed وDatadog وSamsung. يرفع التمويل إجمالي ما جمعته Patronus AI إلى 70 مليون دولار.
لا تسوق الشركة روبوت محادثة أو نموذجا آخر. إنها تبني ما تسميه نماذج عوالم رقمية: نسخا من مواقع وأنظمة داخلية يمكن اختبار وكلاء الذكاء الاصطناعي داخلها بعد التدريب. الهدف هو كشف ما إذا كان الوكيل يستطيع إكمال عمل متعدد الخطوات بشكل صحيح، لا مجرد تحقيق نتيجة قوية في معيار اختبار.
هذا الفرق مهم للعملاء الذين يريدون من الوكلاء حجز رحلات أو إجراء تحليل مالي أو العمل عبر أدوات برمجية. يستطيع المعيار إظهار أداء النموذج في اختبار محدد، لكن Patronus تبيع بيئات مضبوطة يمكن فيها فحص سلوك الوكيل عبر مهام أكثر تنوعا.
نمو الإيرادات يجذب التمويل
تقول Patronus AI إن الإيرادات نمت 15 ضعفا خلال العام الماضي. وقال Glenn Solomon، المدير الإداري في Notable Capital، إن كل مختبر ذكاء اصطناعي حدودي تقريبا وكثيرا من الشركات الناشئة الصاعدة أصبحوا عملاء، ووصف الطلب على بيئات الشركة المحاكاة بأنه شبه نهم.
تمنح هذه الادعاءات الجولة دليلا أكبر من إطلاق أداة ذكاء اصطناعي عادية. لكنها تترك حدودا تجارية. لم تنشر Patronus الإيرادات أو عدد العملاء أو قيم العقود أو أرقام الاحتفاظ، لذلك يبين إعلان التمويل زخما من دون صورة تشغيلية كاملة.
توفر الشركة حاليا عوالم رقمية محاكاة لهندسة البرمجيات والتمويل. قال Kannappan إن الشركة الناشئة تركز على المشكلات التي يمكن فحصها والتحقق منها فورا، بينما تبقى المجالات الأصعب على التحقق خارج الموجة الأولى من العمل.
وتضع Patronus المنتج أيضا ضمن التعلم المعزز. يستطيع الوكلاء العمل داخل البيئة المحاكاة، وتلقي مكافآت عند إكمال المهمة بنجاح وعقوبات عند ارتكاب الأخطاء. تقارن الشركة النهج بمحاكاة المركبات الذاتية القيادة، حيث يمكن اختبار المخاطر النادرة قبل مواجهة السيارات لها على الطرق العامة.
الوكلاء طويلي التشغيل هم المشكلة الصعبة
الهدف الأصعب هو المدة. قال Kannappan إن Patronus تريد إنشاء بيئات يستطيع فيها الوكيل العمل لمدة 10 ساعات أو 10 أيام أو 10 أسابيع. هذا مستوى موثوقية مختلف عن الرد على طلب أو إكمال سير عمل قصير.
تقول الشركة الناشئة إن منافستها الرئيسية ليست الموردين الآخرين فقط. تعتقد Patronus أن مختبرات الذكاء الاصطناعي الحدودية بنت بالفعل فرقا داخلية لتقييم سلوك الوكلاء. وتساعد شركات بيانات بشرية مثل Mercor وSurge صانعي النماذج في التعلم المعزز، لكن Patronus تقول إنها تقيم سلوك الوكلاء من دون تدخل بشري.
يجعل هذا التمويل قصة حوكمة ذكاء اصطناعي مؤسسية بقدر ما هو قصة رأس مال مخاطر. تحتاج الشركات التي تعتمد الوكلاء إلى معرفة ما إذا كانت الأنظمة المؤتمتة تستطيع التعامل مع الاستثناءات وتجنب الاختصارات وإنهاء المهام من دون إصلاح بشري مستمر. تملك Patronus التمويل وطلب المستثمرين وقطاعات مسماة للاستخدام المبكر، بينما يبقى الإثبات غير المحسوم هو ما إذا كانت البيئات المحاكاة تستطيع توقع سلوك الوكلاء أثناء عمل طويل وفوضوي خارج عالم الاختبار.















