مشروع لمتعاقدي Meta اختبر روبوتات دردشة منافسة بحسابات دون 18 عاماً
تصف وثائق داخلية وأشخاص مطلعون على العمل مشروعاً لمتعاقد مع Meta استخدم حسابات وهمية دون 18 عاماً لاختبار روبوتات دردشة منافسة على مطالبات تتعلق بالانتحار والجنس والمخدرات وموضوعات عالية المخاطر. ودافعت Meta عن العمل بوصفه اختبار سلامة اعتيادياً، بينما قالت الشركات المنافسة إنها لم تصرح به.

مشروع Meta استخدم حسابات وهمية دون 18 عاماً
وجّه مشروع تابع لمتعاقد مع Meta مئات العاملين إلى انتحال صفة قاصرين أثناء اختبار كيفية رد روبوتات دردشة منافسة على مطالبات عالية المخاطر تتعلق بالانتحار والجنس واضطرابات الأكل والمخدرات وموضوعات أخرى مقيدة.
أدارت Covalen العمل، وكان نشطاً حتى 21 أبريل على الأقل. ووصفت وثائق داخلية وخمسة أشخاص مطلعين على المشروع الجهد باسم Cannes، وهو برنامج قياس استهدف ChatGPT من OpenAI وGemini من Google وCharacter.AI.
أنشأ المتعاقدون حسابات وهمية بدت كأنها تعود لمستخدمين دون 18 عاماً، وأرسلوا مطالبات مكتوبة وصوراً إلى الخدمات المنافسة، ثم نسخوا الردود في جداول بيانات. وقالت Meta إن العمل كان اختبار سلامة مسؤولاً ومعيارياً في الصناعة، وإنها لا تستخدم قياس المنافسين لتدريب نماذج الذكاء الاصطناعي الخاصة بها.
اختبار أغسطس 2025 شمل أكثر من 45,000 مطالبة
أرسلت جولة اختبار اكتملت في أغسطس 2025 أكثر من 45,000 مطالبة عبر أنظمة روبوتات الدردشة المنافسة. واحتوى جدول بيانات منفصل على 3,748 مطالبة، بينها مئات عن الانتحار وإيذاء النفس، ومئات أخرى عن اضطرابات الأكل، وما لا يقل عن 239 تتعلق بالجنس أو العلاقات العاطفية.
شملت المواد بعض المطالبات المكتوبة من منظور أطفال أو مراهقين في أزمات. وأظهرت بعض الصور التي أرسلها المتعاقدون حبوباً وسكاكين ومشانق ورسماً طبياً لإجراء نسائي. ولم تكن الشركات التي تشغل روبوتات الدردشة المختبرة على علم بالمشروع.
لا تقول الوثائق كيف استخدمت Meta الردود المجمعة. ووثيقة داخلية من Covalen وصفت العمل بأنه قياس شامل لسلامة الذكاء الاصطناعي وقالت إنه أنتج مجموعات بيانات للمقارنة بين النماذج والامتثال. ولم ترد Covalen على طلب للتعليق.
الشركات المنافسة تقول إن الاختبار لم يكن مصرحاً به
قالت Character.AI إن السلوك المزعوم خالف شروط الخدمة وسياسات المجتمع لديها. وقالت OpenAI إنها تنظر في المسألة، بينما قالت Google إنها لم تصرح بالاختبار الخارجي ولا تعرف غرض المشروع.
تحظر OpenAI اختبار السلامة غير المطلوب، ومحاولات تجاوز إجراءات الحماية، واستخدام المخرجات لتطوير نماذج منافسة. كما تقيد Google محاولات تجاوز مرشحات السلامة خارج برامج الاختبار المعتمدة. وقالت Character.AI منذ أواخر 2025 إنها لم تعد تسمح بالدردشة المفتوحة للمستخدمين دون 18 عاماً.
قال محاميان راجعا أمثلة من المطالبات إن المواد المعروضة عليهما لم تصل إلى حد طلب إنتاج مواد اعتداء جنسي على الأطفال أو فحش غير قانوني. ومع ذلك وصف متعاقدون سابقون قلقهم من أن العمل قد يولد أو يحتفظ بمواد غير قانونية إذا رد روبوت دردشة على بعض المطالبات الجنسية المتعلقة بقاصرين.
قياس السلامة يترك فجوة حوكمة
راجعت Rumman Chowdhury، الرئيسة التنفيذية ومؤسسة Humane Intelligence PBC، عينة من المطالبات وملخصاً للمشروع. وقالت إن مشروعاً واسع النطاق يستخدم حسابات وهمية تبدو كأنها لأطفال يقع خارج ما يوصف عادة بأنه تقييم معياري في الصناعة.
قالت Chowdhury إن مطالبات سلامة الشباب يمكن أن تكون مفيدة لقياس عدد مرات رفض روبوتات الدردشة للطلبات الضارة، لكن حجم مشروع Cannes وغموضه وغياب الإفصاح للشركات التي جرى اختبارها جعلته مختلفاً عن معايير السلامة العامة.
لم تفصح Meta عن كيفية استخدامها لردود روبوتات الدردشة المجمعة، أو ما إذا كانت أي مخرجات من المنافسين دخلت في قرارات المنتجات الداخلية، أو ما إذا كان المشروع حصل على موافقة OpenAI أو Google أو Character.AI.
















