مشروع لمتعاقدي Meta اختبر روبوتات دردشة منافسة بحسابات دون 18 عاماً

بقلممكتب الذكاء الاصطناعي والمؤسسات في SendTech Timesتغطية مكتبية محررة ومراجعة المصدر|المصدر: Wired

موجز التحرير

تصف وثائق داخلية وأشخاص مطلعون على العمل مشروعاً لمتعاقد مع Meta استخدم حسابات وهمية دون 18 عاماً لاختبار روبوتات دردشة منافسة على مطالبات تتعلق بالانتحار والجنس والمخدرات وموضوعات عالية المخاطر. ودافعت Meta عن العمل بوصفه اختبار سلامة اعتيادياً، بينما قالت الشركات المنافسة إنها لم تصرح به.

تمت المراجعة مقابل مواد المصدرتحرير مكتب الذكاء الاصطناعي والمؤسسات في SendTech Times

مشروع لمتعاقدي Meta اختبر روبوتات دردشة منافسة بحسابات دون 18 عاماً

مصدر الصورة: Wired

مشروع Meta استخدم حسابات وهمية دون 18 عاماً

وجّه مشروع تابع لمتعاقد مع Meta مئات العاملين إلى انتحال صفة قاصرين أثناء اختبار كيفية رد روبوتات دردشة منافسة على مطالبات عالية المخاطر تتعلق بالانتحار والجنس واضطرابات الأكل والمخدرات وموضوعات أخرى مقيدة.

أدارت Covalen العمل، وكان نشطاً حتى 21 أبريل على الأقل. ووصفت وثائق داخلية وخمسة أشخاص مطلعين على المشروع الجهد باسم Cannes، وهو برنامج قياس استهدف ChatGPT من OpenAI وGemini من Google وCharacter.AI.

أنشأ المتعاقدون حسابات وهمية بدت كأنها تعود لمستخدمين دون 18 عاماً، وأرسلوا مطالبات مكتوبة وصوراً إلى الخدمات المنافسة، ثم نسخوا الردود في جداول بيانات. وقالت Meta إن العمل كان اختبار سلامة مسؤولاً ومعيارياً في الصناعة، وإنها لا تستخدم قياس المنافسين لتدريب نماذج الذكاء الاصطناعي الخاصة بها.

اختبار أغسطس 2025 شمل أكثر من 45,000 مطالبة

أرسلت جولة اختبار اكتملت في أغسطس 2025 أكثر من 45,000 مطالبة عبر أنظمة روبوتات الدردشة المنافسة. واحتوى جدول بيانات منفصل على 3,748 مطالبة، بينها مئات عن الانتحار وإيذاء النفس، ومئات أخرى عن اضطرابات الأكل، وما لا يقل عن 239 تتعلق بالجنس أو العلاقات العاطفية.

شملت المواد بعض المطالبات المكتوبة من منظور أطفال أو مراهقين في أزمات. وأظهرت بعض الصور التي أرسلها المتعاقدون حبوباً وسكاكين ومشانق ورسماً طبياً لإجراء نسائي. ولم تكن الشركات التي تشغل روبوتات الدردشة المختبرة على علم بالمشروع.

لا تقول الوثائق كيف استخدمت Meta الردود المجمعة. ووثيقة داخلية من Covalen وصفت العمل بأنه قياس شامل لسلامة الذكاء الاصطناعي وقالت إنه أنتج مجموعات بيانات للمقارنة بين النماذج والامتثال. ولم ترد Covalen على طلب للتعليق.

الشركات المنافسة تقول إن الاختبار لم يكن مصرحاً به

قالت Character.AI إن السلوك المزعوم خالف شروط الخدمة وسياسات المجتمع لديها. وقالت OpenAI إنها تنظر في المسألة، بينما قالت Google إنها لم تصرح بالاختبار الخارجي ولا تعرف غرض المشروع.

تحظر OpenAI اختبار السلامة غير المطلوب، ومحاولات تجاوز إجراءات الحماية، واستخدام المخرجات لتطوير نماذج منافسة. كما تقيد Google محاولات تجاوز مرشحات السلامة خارج برامج الاختبار المعتمدة. وقالت Character.AI منذ أواخر 2025 إنها لم تعد تسمح بالدردشة المفتوحة للمستخدمين دون 18 عاماً.

قال محاميان راجعا أمثلة من المطالبات إن المواد المعروضة عليهما لم تصل إلى حد طلب إنتاج مواد اعتداء جنسي على الأطفال أو فحش غير قانوني. ومع ذلك وصف متعاقدون سابقون قلقهم من أن العمل قد يولد أو يحتفظ بمواد غير قانونية إذا رد روبوت دردشة على بعض المطالبات الجنسية المتعلقة بقاصرين.

قياس السلامة يترك فجوة حوكمة

راجعت Rumman Chowdhury، الرئيسة التنفيذية ومؤسسة Humane Intelligence PBC، عينة من المطالبات وملخصاً للمشروع. وقالت إن مشروعاً واسع النطاق يستخدم حسابات وهمية تبدو كأنها لأطفال يقع خارج ما يوصف عادة بأنه تقييم معياري في الصناعة.

قالت Chowdhury إن مطالبات سلامة الشباب يمكن أن تكون مفيدة لقياس عدد مرات رفض روبوتات الدردشة للطلبات الضارة، لكن حجم مشروع Cannes وغموضه وغياب الإفصاح للشركات التي جرى اختبارها جعلته مختلفاً عن معايير السلامة العامة.

لم تفصح Meta عن كيفية استخدامها لردود روبوتات الدردشة المجمعة، أو ما إذا كانت أي مخرجات من المنافسين دخلت في قرارات المنتجات الداخلية، أو ما إذا كان المشروع حصل على موافقة OpenAI أو Google أو Character.AI.

#AI safety #chatbot governance #Meta #OpenAI

مقالات ذات صلة

المزيد

الذكاء الاصطناعي

دعوى xAI تحول مزاعم سلامة Grok إلى اختبار حوكمة

يزعم مهندس سابق في xAI أنه أُقيل بعد إثارة مخاوف بشأن سلامة Grok، ما يضع ضمانات روبوت الدردشة وادعاءات اختبار EU والمساءلة الداخلية في قلب نزاع قضائي يشمل xAI وSpaceX.

الذكاء الاصطناعي

حديث طرح OpenAI يسبق اجتماعات المستثمرين والجدول الزمني

قدمت OpenAI ملفا سريا إلى SEC، لكن أشخاصا مطلعين على الشركة يقولون إنها لم تعقد اجتماعات ما قبل الطرح مع المستثمرين ولم تحدد جدولا رسميا للإدراج.

الذكاء الاصطناعي

OpenAI تقول إن حسابات مرتبطة بالصين استخدمت ChatGPT لاستهداف نقاش مراكز البيانات في U.S.

وجدت OpenAI حسابات مرتبطة بالصين تستخدم ChatGPT لإنشاء منشورات ورسوم وتعليقات حول معارضة مراكز البيانات في U.S. وسياسة الرسوم، ما يوضح كيف يمكن أن تصبح نزاعات بنية AI التحتية هدفا لعمليات تأثير منخفضة التكلفة.

الذكاء الاصطناعي

بنية ذكاء Apple تضع Google وNvidia داخل اختبار الخصوصية

تستخدم Apple كلاً من Google وNvidia لدعم أكثر نماذجها السحابية تقدماً، مع محاولة إبقاء Apple Intelligence قائماً على التوجيه الخاص والنماذج المملوكة وسياق الجهاز.