Patronus AI تجمع 50 مليون دولار مع انتقال اختبارات الوكلاء بعد المعايير

بقلممكتب البنية التحتية في SendTech Timesتغطية مكتبية محررة ومراجعة المصدر|المصدر: TechCrunch

موجز التحرير

جمعت Patronus AI جولة Series B بقيمة 50 مليون دولار لبناء بيئات رقمية محاكاة لاختبار وكلاء الذكاء الاصطناعي، لكن أدلتها ما زالت تتركز على نمو الإيرادات وطلب العملاء لا على إثبات واسع لقدرة الوكلاء على تشغيل مهام طويلة بثبات.

تمت المراجعة مقابل مواد المصدرتحرير مكتب البنية التحتية في SendTech Times

Patronus AI تجمع 50 مليون دولار مع انتقال اختبارات الوكلاء بعد المعايير

مصدر الصورة: TechCrunch / Patronus AI

Patronus تبيع اختبار الوكلاء بعد المعايير

جمعت Patronus AI جولة Series B بقيمة 50 مليون دولار لبرمجيات تختبر وكلاء الذكاء الاصطناعي داخل بيئات رقمية محاكاة، في إشارة إلى أن موثوقية الوكلاء أصبحت بند إنفاق لدى مختبرات النماذج والشركات التي تبني سير عمل مؤتمتا.

تأسست الشركة الناشئة في San Francisco عام 2023 على يد Anand Kannappan وRebecca Qian، وهما باحثان سابقان في Meta AI. قادت Greenfield Partners الجولة الجديدة، مع مشاركة Notable Capital وLightspeed وDatadog وSamsung. يرفع التمويل إجمالي ما جمعته Patronus AI إلى 70 مليون دولار.

لا تسوق الشركة روبوت محادثة أو نموذجا آخر. إنها تبني ما تسميه نماذج عوالم رقمية: نسخا من مواقع وأنظمة داخلية يمكن اختبار وكلاء الذكاء الاصطناعي داخلها بعد التدريب. الهدف هو كشف ما إذا كان الوكيل يستطيع إكمال عمل متعدد الخطوات بشكل صحيح، لا مجرد تحقيق نتيجة قوية في معيار اختبار.

هذا الفرق مهم للعملاء الذين يريدون من الوكلاء حجز رحلات أو إجراء تحليل مالي أو العمل عبر أدوات برمجية. يستطيع المعيار إظهار أداء النموذج في اختبار محدد، لكن Patronus تبيع بيئات مضبوطة يمكن فيها فحص سلوك الوكيل عبر مهام أكثر تنوعا.

نمو الإيرادات يجذب التمويل

تقول Patronus AI إن الإيرادات نمت 15 ضعفا خلال العام الماضي. وقال Glenn Solomon، المدير الإداري في Notable Capital، إن كل مختبر ذكاء اصطناعي حدودي تقريبا وكثيرا من الشركات الناشئة الصاعدة أصبحوا عملاء، ووصف الطلب على بيئات الشركة المحاكاة بأنه شبه نهم.

تمنح هذه الادعاءات الجولة دليلا أكبر من إطلاق أداة ذكاء اصطناعي عادية. لكنها تترك حدودا تجارية. لم تنشر Patronus الإيرادات أو عدد العملاء أو قيم العقود أو أرقام الاحتفاظ، لذلك يبين إعلان التمويل زخما من دون صورة تشغيلية كاملة.

توفر الشركة حاليا عوالم رقمية محاكاة لهندسة البرمجيات والتمويل. قال Kannappan إن الشركة الناشئة تركز على المشكلات التي يمكن فحصها والتحقق منها فورا، بينما تبقى المجالات الأصعب على التحقق خارج الموجة الأولى من العمل.

وتضع Patronus المنتج أيضا ضمن التعلم المعزز. يستطيع الوكلاء العمل داخل البيئة المحاكاة، وتلقي مكافآت عند إكمال المهمة بنجاح وعقوبات عند ارتكاب الأخطاء. تقارن الشركة النهج بمحاكاة المركبات الذاتية القيادة، حيث يمكن اختبار المخاطر النادرة قبل مواجهة السيارات لها على الطرق العامة.

الوكلاء طويلي التشغيل هم المشكلة الصعبة

الهدف الأصعب هو المدة. قال Kannappan إن Patronus تريد إنشاء بيئات يستطيع فيها الوكيل العمل لمدة 10 ساعات أو 10 أيام أو 10 أسابيع. هذا مستوى موثوقية مختلف عن الرد على طلب أو إكمال سير عمل قصير.

تقول الشركة الناشئة إن منافستها الرئيسية ليست الموردين الآخرين فقط. تعتقد Patronus أن مختبرات الذكاء الاصطناعي الحدودية بنت بالفعل فرقا داخلية لتقييم سلوك الوكلاء. وتساعد شركات بيانات بشرية مثل Mercor وSurge صانعي النماذج في التعلم المعزز، لكن Patronus تقول إنها تقيم سلوك الوكلاء من دون تدخل بشري.

يجعل هذا التمويل قصة حوكمة ذكاء اصطناعي مؤسسية بقدر ما هو قصة رأس مال مخاطر. تحتاج الشركات التي تعتمد الوكلاء إلى معرفة ما إذا كانت الأنظمة المؤتمتة تستطيع التعامل مع الاستثناءات وتجنب الاختصارات وإنهاء المهام من دون إصلاح بشري مستمر. تملك Patronus التمويل وطلب المستثمرين وقطاعات مسماة للاستخدام المبكر، بينما يبقى الإثبات غير المحسوم هو ما إذا كانت البيئات المحاكاة تستطيع توقع سلوك الوكلاء أثناء عمل طويل وفوضوي خارج عالم الاختبار.

#Patronus AI #agent evaluation #AI benchmarks #Greenfield Partners

مقالات ذات صلة

المزيد

الذكاء الاصطناعي

جولة كورالوجيكس البالغة 200 مليون دولار تضع مراقبة وكلاء الذكاء الاصطناعي تحت أنظار المؤسسات

جمعت كورالوجيكس 200 مليون دولار في تمويل من السلسلة F لتوسيع أدوات مراقبة البرمجيات المرتبطة بعمليات وكلاء الذكاء الاصطناعي. قيّمت الجولة الشركة عند 1.6 مليار دولار بعد الاستثمار، ورفعت إجمالي رأس المال الذي جمعته إلى 550 مليون دولار. الاختبار العملي هو ما إذا كان استخدام المؤسسات لوكلاء الذكاء الاصطناعي سيحوّل الإنفاق على المراقبة التشغيلية إلى نمو مستدام لكورالوجيكس.

الذكاء الاصطناعي

تقييم Cognition AI البالغ 26 مليار دولار يختبر جدوى وكلاء البرمجة للشركات

جمعت Cognition AI، المطورة لوكيل البرمجة Devin، أكثر من مليار دولار بتقييم يبلغ 26 مليار دولار، وفقاً لـ TMTPost. ويعكس التمويل رهانات كبيرة على وكلاء البرمجة داخل الشركات، مع استمرار أسئلة الموثوقية والمنافسة.

الذكاء الاصطناعي

جولة Jedify بقيمة $24M تختبر مشكلة السياق في ذكاء المؤسسات

جمعت Jedify تمويلا قدره $24 million لتوسيع منصة context graph لوكلاء الذكاء الاصطناعي في المؤسسات، مع مشاركة Snowflake كمستثمر استراتيجي واختبار عملاء مبكرين لنشر يراعي الصلاحيات.