News
AI SHIFT:

مشروع لمتعاقدي Meta اختبر روبوتات دردشة منافسة بحسابات دون 18 عاماً

موجز التحرير

تصف وثائق داخلية وأشخاص مطلعون على العمل مشروعاً لمتعاقد مع Meta استخدم حسابات وهمية دون 18 عاماً لاختبار روبوتات دردشة منافسة على مطالبات تتعلق بالانتحار والجنس والمخدرات وموضوعات عالية المخاطر. ودافعت Meta عن العمل بوصفه اختبار سلامة اعتيادياً، بينما قالت الشركات المنافسة إنها لم تصرح به.

تمت المراجعة مقابل مواد المصدرتحرير مكتب الذكاء الاصطناعي والمؤسسات في SendTech Times
مشروع لمتعاقدي Meta اختبر روبوتات دردشة منافسة بحسابات دون 18 عاماً
مصدر الصورة: Wired

مشروع Meta استخدم حسابات وهمية دون 18 عاماً

وجّه مشروع تابع لمتعاقد مع Meta مئات العاملين إلى انتحال صفة قاصرين أثناء اختبار كيفية رد روبوتات دردشة منافسة على مطالبات عالية المخاطر تتعلق بالانتحار والجنس واضطرابات الأكل والمخدرات وموضوعات أخرى مقيدة.

أدارت Covalen العمل، وكان نشطاً حتى 21 أبريل على الأقل. ووصفت وثائق داخلية وخمسة أشخاص مطلعين على المشروع الجهد باسم Cannes، وهو برنامج قياس استهدف ChatGPT من OpenAI وGemini من Google وCharacter.AI.

أنشأ المتعاقدون حسابات وهمية بدت كأنها تعود لمستخدمين دون 18 عاماً، وأرسلوا مطالبات مكتوبة وصوراً إلى الخدمات المنافسة، ثم نسخوا الردود في جداول بيانات. وقالت Meta إن العمل كان اختبار سلامة مسؤولاً ومعيارياً في الصناعة، وإنها لا تستخدم قياس المنافسين لتدريب نماذج الذكاء الاصطناعي الخاصة بها.

اختبار أغسطس 2025 شمل أكثر من 45,000 مطالبة

أرسلت جولة اختبار اكتملت في أغسطس 2025 أكثر من 45,000 مطالبة عبر أنظمة روبوتات الدردشة المنافسة. واحتوى جدول بيانات منفصل على 3,748 مطالبة، بينها مئات عن الانتحار وإيذاء النفس، ومئات أخرى عن اضطرابات الأكل، وما لا يقل عن 239 تتعلق بالجنس أو العلاقات العاطفية.

شملت المواد بعض المطالبات المكتوبة من منظور أطفال أو مراهقين في أزمات. وأظهرت بعض الصور التي أرسلها المتعاقدون حبوباً وسكاكين ومشانق ورسماً طبياً لإجراء نسائي. ولم تكن الشركات التي تشغل روبوتات الدردشة المختبرة على علم بالمشروع.

لا تقول الوثائق كيف استخدمت Meta الردود المجمعة. ووثيقة داخلية من Covalen وصفت العمل بأنه قياس شامل لسلامة الذكاء الاصطناعي وقالت إنه أنتج مجموعات بيانات للمقارنة بين النماذج والامتثال. ولم ترد Covalen على طلب للتعليق.

الشركات المنافسة تقول إن الاختبار لم يكن مصرحاً به

قالت Character.AI إن السلوك المزعوم خالف شروط الخدمة وسياسات المجتمع لديها. وقالت OpenAI إنها تنظر في المسألة، بينما قالت Google إنها لم تصرح بالاختبار الخارجي ولا تعرف غرض المشروع.

تحظر OpenAI اختبار السلامة غير المطلوب، ومحاولات تجاوز إجراءات الحماية، واستخدام المخرجات لتطوير نماذج منافسة. كما تقيد Google محاولات تجاوز مرشحات السلامة خارج برامج الاختبار المعتمدة. وقالت Character.AI منذ أواخر 2025 إنها لم تعد تسمح بالدردشة المفتوحة للمستخدمين دون 18 عاماً.

قال محاميان راجعا أمثلة من المطالبات إن المواد المعروضة عليهما لم تصل إلى حد طلب إنتاج مواد اعتداء جنسي على الأطفال أو فحش غير قانوني. ومع ذلك وصف متعاقدون سابقون قلقهم من أن العمل قد يولد أو يحتفظ بمواد غير قانونية إذا رد روبوت دردشة على بعض المطالبات الجنسية المتعلقة بقاصرين.

قياس السلامة يترك فجوة حوكمة

راجعت Rumman Chowdhury، الرئيسة التنفيذية ومؤسسة Humane Intelligence PBC، عينة من المطالبات وملخصاً للمشروع. وقالت إن مشروعاً واسع النطاق يستخدم حسابات وهمية تبدو كأنها لأطفال يقع خارج ما يوصف عادة بأنه تقييم معياري في الصناعة.

قالت Chowdhury إن مطالبات سلامة الشباب يمكن أن تكون مفيدة لقياس عدد مرات رفض روبوتات الدردشة للطلبات الضارة، لكن حجم مشروع Cannes وغموضه وغياب الإفصاح للشركات التي جرى اختبارها جعلته مختلفاً عن معايير السلامة العامة.

لم تفصح Meta عن كيفية استخدامها لردود روبوتات الدردشة المجمعة، أو ما إذا كانت أي مخرجات من المنافسين دخلت في قرارات المنتجات الداخلية، أو ما إذا كان المشروع حصل على موافقة OpenAI أو Google أو Character.AI.

شارك هذا المقال
inXf

مقالات ذات صلة

المزيد
دعوى xAI تحول مزاعم سلامة Grok إلى اختبار حوكمة
الذكاء الاصطناعي

دعوى xAI تحول مزاعم سلامة Grok إلى اختبار حوكمة

يزعم مهندس سابق في xAI أنه أُقيل بعد إثارة مخاوف بشأن سلامة Grok، ما يضع ضمانات روبوت الدردشة وادعاءات اختبار EU والمساءلة الداخلية في قلب نزاع قضائي يشمل xAI وSpaceX.

حديث طرح OpenAI يسبق اجتماعات المستثمرين والجدول الزمني
الذكاء الاصطناعي

حديث طرح OpenAI يسبق اجتماعات المستثمرين والجدول الزمني

قدمت OpenAI ملفا سريا إلى SEC، لكن أشخاصا مطلعين على الشركة يقولون إنها لم تعقد اجتماعات ما قبل الطرح مع المستثمرين ولم تحدد جدولا رسميا للإدراج.

OpenAI تقول إن حسابات مرتبطة بالصين استخدمت ChatGPT لاستهداف نقاش مراكز البيانات في U.S.
الذكاء الاصطناعي

OpenAI تقول إن حسابات مرتبطة بالصين استخدمت ChatGPT لاستهداف نقاش مراكز البيانات في U.S.

وجدت OpenAI حسابات مرتبطة بالصين تستخدم ChatGPT لإنشاء منشورات ورسوم وتعليقات حول معارضة مراكز البيانات في U.S. وسياسة الرسوم، ما يوضح كيف يمكن أن تصبح نزاعات بنية AI التحتية هدفا لعمليات تأثير منخفضة التكلفة.

بنية ذكاء Apple تضع Google وNvidia داخل اختبار الخصوصية
الذكاء الاصطناعي

بنية ذكاء Apple تضع Google وNvidia داخل اختبار الخصوصية

تستخدم Apple كلاً من Google وNvidia لدعم أكثر نماذجها السحابية تقدماً، مع محاولة إبقاء Apple Intelligence قائماً على التوجيه الخاص والنماذج المملوكة وسياق الجهاز.

التالي

المزيد من الأخبار

كل الأخبار
حكم المحكمة العليا يعيد سيطرة منظمي العملات المشفرة إلى مفاوضات مجلس الشيوخرأس المال والسياسات30 يونيو 2026حكم المحكمة العليا يعيد سيطرة منظمي العملات المشفرة إلى مفاوضات مجلس الشيوخيوسع حكم Supreme Court في قضية Trump v. Slaughter سلطة الرئيس في عزل مفوضي الوكالات الفدرالية بينما يبقى Clarity Act قيد التفاوض في Senate. ويترك الحكم استقلال SEC وCFTC مرتبطاً بتعيينات لم تتم بعد.صفقة Onsemi وSynaptics تضيف حوسبة ذكاء اصطناعي طرفية مع بقاء الموافقة معلقةالرقائق وأشباه الموصلات30 يونيو 2026صفقة Onsemi وSynaptics تضيف حوسبة ذكاء اصطناعي طرفية مع بقاء الموافقة معلقةتشتري Onsemi شركة Synaptics في صفقة أسهم بالكامل تقدر بنحو $7 billion لإضافة حوسبة ذكاء اصطناعي طرفية واتصال لاسلكي وأصول واجهة الإنسان والآلة. ومن المتوقع إغلاق الصفقة في منتصف 2027 إذا وافق المنظمون، لكن عمليات نشر العملاء ومراحل الدمج ما زالت غير معلنة.مشروع Warren لبيانات الصحة يضيف روبوتات الذكاء الاصطناعي إلى حظر الوسطاءرأس المال والسياسات30 يونيو 2026مشروع Warren لبيانات الصحة يضيف روبوتات الذكاء الاصطناعي إلى حظر الوسطاءسيحظر تحديث مقترح لقانون Health and Location Data Protection Act بيع بيانات الصحة والموقع للأمريكيين إلى وسطاء البيانات، بما في ذلك المعلومات المشتركة مع روبوتات الذكاء الاصطناعي. وذكرت The Verge أن المشروع سيمنح FTC مدة 180 يوماً لوضع القواعد ويخصص $1 billion على مدى 10 سنوات للإنفاذ.Nasdaq Verafin تضيف وكلاء ذكاء اصطناعي لمراجعة الاحتيال وAML في البنوكالتقنية المالية والمدفوعات الرقمية30 يونيو 2026Nasdaq Verafin تضيف وكلاء ذكاء اصطناعي لمراجعة الاحتيال وAML في البنوكقالت Nasdaq Verafin إن Agentic AI Workforce سيضيف وكلاء لمحللي الاحتيال وAML للمؤسسات المالية، مع توقع الإتاحة العامة في الربع الثالث من 2026. واستشهدت الشركة بتخفيضات مبكرة في أعباء العمل، لكنها لم تكشف الأسعار أو تحققاً معيارياً مستقلاً.بورصة البحرين تحدد 2028 هدفاً لترقية CSD بتقنية Nasdaqرأس المال والسياسات30 يونيو 2026بورصة البحرين تحدد 2028 هدفاً لترقية CSD بتقنية Nasdaqذكرت Economy Middle East أن Bahrain Bourse تخطط لنقل Bahrain Clear إلى تقنية Nasdaq Eqlipse CSD، مع جدولة النشر الكامل في الربع الرابع من 2028. ويربط التقرير الترقية بتحديث ما بعد التداول، بينما تبقى تكلفة المشروع ومراحل الهجرة غير معلنة.كاليفورنيا تفتح استخدام Claude لموظفي الحكومة عبر اتفاق مع Anthropicرأس المال والسياسات30 يونيو 2026كاليفورنيا تفتح استخدام Claude لموظفي الحكومة عبر اتفاق مع Anthropicتستطيع وكالات كاليفورنيا والحكومات المحلية استخدام Claude من Anthropic عبر اتفاق مخفض يشمل التدريب والدعم. يمنح الاتفاق الولاية مساراً لاستخدام AI في الحكومة، لكن الإعلان العام لم يذكر مدة العقد أو توقيت الطرح أو نتائج خدمة مقاسة.AMD EPYC 8005 يرفع عدد أنوية SP6 من دون بيانات طرح لدى العملاءالرقائق وأشباه الموصلات30 يونيو 2026AMD EPYC 8005 يرفع عدد أنوية SP6 من دون بيانات طرح لدى العملاءأفاد ServeTheHome بأن AMD EPYC 8005 “Sorano” يحافظ على مقبس الخوادم SP6 مع بلوغ 84 نواة وذاكرة DDR5-6400 ودعم CXL 2.0. وتوضح المادة الاختبارية الممولة أن AMD أرسلت المعالجات، بينما لم تُذكر عمليات نشر لدى العملاء أو بيانات طلبات.صفقة Rocket Lab وIridium تضيف طيفا L-band إلى توسع الاتصالات الفضائيةالاتصالات والربط الشبكي30 يونيو 2026صفقة Rocket Lab وIridium تضيف طيفا L-band إلى توسع الاتصالات الفضائيةوافقت Rocket Lab على الاستحواذ على Iridium في صفقة تقيم مشغل الأقمار الصناعية بنحو 8.0 مليارات دولار، بما يربط الإطلاق وتصنيع المركبات الفضائية بشبكة L-band و2.55 مليون مشترك وخطط direct-to-device.أوكرانيا تنقل 8.3 مليون دولار من USDT المصادرة إلى إدارة الدولةرأس المال والسياسات30 يونيو 2026أوكرانيا تنقل 8.3 مليون دولار من USDT المصادرة إلى إدارة الدولةنقلت أوكرانيا أكثر من 8.3 مليون دولار من USDT المصادرة إلى إدارة الدولة عبر ARMA، لكن الأصول لم تصادر رسميا وما زال أربعة مشتبه بهم من دون إدانة.MRAgent يخفض استهلاك وكلاء الذاكرة الطويلة إلى 118 ألف رمز في اختبارات معياريةالذكاء الاصطناعي29 يونيو 2026MRAgent يخفض استهلاك وكلاء الذاكرة الطويلة إلى 118 ألف رمز في اختبارات معياريةطور باحثون في الجامعة الوطنية في سنغافورة MRAgent لإعادة بناء الذاكرة عبر رسم Cue-Tag-Content، مع نقل VentureBeat لاستخدام LongMemEval نحو 118 ألف رمز لكل عينة مقابل 632 ألفا في A-Mem و3.26 مليون في LangMem.SpaceX تسعر بيع سندات بقيمة 25 مليار دولار بعد طلبات بنحو 90 مليار دولاررأس المال والسياسات29 يونيو 2026SpaceX تسعر بيع سندات بقيمة 25 مليار دولار بعد طلبات بنحو 90 مليار دولاررفعت SpaceX بيع السندات إلى 25 مليار دولار بعد طلبات تقارب 90 مليار دولار، بينما أشار محللون إلى الإنفاق الرأسمالي وخسارة صافية قدرها 5 مليارات دولار وانكشاف خدمة الدين على تنفيذ Starlink وStarship.خطة ماليزيا لعناوين IP تتحدى قواعد سجل APNICالسياسة29 يونيو 2026خطة ماليزيا لعناوين IP تتحدى قواعد سجل APNICفتحت ماليزيا استشارة حول ما إذا كان ينبغي للجهة التنظيمية إدارة عناوين IP وأرقام الأنظمة المستقلة، ما يضعها أمام خلاف سياساتي مع وقف APNIC لقبول سجلات إنترنت وطنية جديدة.