Analysis
FUNDING GAP:

Springboards تختبر نموذج Qwen 3 ضد إجابات LLM المتكررة

موجز التحرير

بنت الشركة الأسترالية Springboards نموذج Flint على Alibaba Qwen 3 لإنتاج إجابات أكثر تنوعا في المطالبات المفتوحة. وتجمع مقالة MIT Technology Review بين ادعاء الشركة وورقة فازت في NeurIPS حول تجانس النماذج، مع تحذيرات مستخدمين من أن النموذج الأولي ما زال يتعثر عند الضغط.

تمت المراجعة مقابل مواد المصدرتحرير مكتب الذكاء الاصطناعي والمؤسسات في SendTech Times
Springboards تختبر نموذج Qwen 3 ضد إجابات LLM المتكررة
مصدر الصورة: MIT Technology Review

Springboards تبني Flint على Qwen 3

بنت الشركة الأسترالية Springboards نموذجا لغويا كبيرا باسم Flint لجعل إجابات روبوتات المحادثة المفتوحة أقل تكرارا. وتعرض الشركة النموذج على مستخدمي الإعلان والتسويق الذين يريدون مخرجات عصف ذهني أكثر تنوعا مما تنتجه الأنظمة الشائعة غالبا.

قال Pip Bingemann، الشريك المؤسس والرئيس التنفيذي لـ Springboards، إن معظم نماذج اللغة مصممة لمحاربة الهلوسة، بينما صمم Flint لدفع اقتراحات أكثر غرابة. وفي عرض وصفته MIT Technology Review، أعطى ChatGPT وClaude العبارة الترويجية البسيطة نفسها، بينما قدم Flint عبارة مختلفة.

بنت الشركة Flint على Qwen 3، النموذج المفتوح المصدر من Alibaba. وقال Kieran Browne، الشريك المؤسس والمدير التقني في Springboards، إن تدريب نموذج أساس مكلف جدا لفريق صغير، لذلك ركزت الشركة على تغيير المواضع التي يدخل فيها النموذج التنوع في مخرجاته.

ورقة بحثية تظهر الإجابات المتكررة

تعمل الشركة الناشئة على مشكلة قاسها باحثو AI أيضا. وجدت ورقة صدرت في نوفمبر بعنوان "Artificial Hivemind" أن نماذج LLM مختلفة غالبا ما تتقارب نحو إجابات متشابهة في المطالبات المفتوحة.

طلب الباحثون من 25 نموذج LLM كتابة استعارة عن الوقت 50 مرة لكل نموذج. وقالت MIT Technology Review إن معظم الإجابات البالغ عددها 1,250 كانت نسخا من "Time is a river" أو "Time is a weaver". وفازت الورقة بجائزة أفضل ورقة في NeurIPS.

قالت OpenAI لـ MIT Technology Review إن تدريب النماذج على تقديم إجابات موثوقة ومتماسكة قد يجعلها تتقارب حول ردود مألوفة وعالية الاحتمال. وقالت OpenAI أيضا إن الدفع بقوة أكبر نحو الحداثة قد يجعل الإجابات أقل موثوقية.

مستخدمو النموذج الأولي يحتاجون حكما بشريا

تقدم Springboards نموذج Flint كخيار ضمن أداة العصف الذهني الخاصة بها، والتي تتيح للفرق الإبداعية دمج نصوص من عدة نماذج LLM. وقالت Zoe Scaman، مؤسسة Bodacious والمديرة الاستراتيجية في 77X، إن Flint دفعها في اتجاهات مختلفة أثناء الاختبارات.

وقالت Scaman أيضا إن الفكرة قوية، لكنها أشارت إلى أن Flint ما زال نموذجا أوليا ويمكن أن يتعثر عندما يضغط عليه المستخدمون كثيرا. ويجعل ذلك الدليل أقرب إلى اختبار للتنوع الإبداعي منه إلى نشر مؤسسي مثبت.

قال Maximilian Weigl، الشريك المؤسس والمدير الاستراتيجي في Uncommon، إن فريقه يستخدم Flint مع ChatGPT وClaude وGemini. وقال أيضا إن الإجابات المتوسطة تكون كافية غالبا، وحذر من نسخ الفرق لمخرجات AI من دون تفكير بشري.

لم تكشف Springboards أسعار Flint أو موعد إطلاق عام أو أعداد العملاء أو التزامات نشر مؤسسي أو نتائج اختبارات مستقلة للنموذج الأولي.

شارك هذا المقال
inXf

مقالات ذات صلة

المزيد
إطلاق Instacart لمساعد البقالة بالذكاء الاصطناعي يختبر قدرة الوكلاء على بناء السلال دون كسر الثقة
الذكاء الاصطناعي

إطلاق Instacart لمساعد البقالة بالذكاء الاصطناعي يختبر قدرة الوكلاء على بناء السلال دون كسر الثقة

أتاحت Instacart مساعد تسوق بالذكاء الاصطناعي لملايين العملاء في الولايات المتحدة، مع خطة للتوسع في U.S. وCanada خلال coming months. ويحول المساعد المطالبات والصور وطلبات العروض إلى سلال باستخدام مخزون حي من nearly 100,000 stores وبيانات من more than 1.6 billion lifetime orders.

دفع اليابان بنظام Gennai يختبر ضوابط الذكاء الاصطناعي في إجابات البرلمان
الذكاء الاصطناعي

دفع اليابان بنظام Gennai يختبر ضوابط الذكاء الاصطناعي في إجابات البرلمان

تستخدم الحكومة اليابانية نظام الذكاء الاصطناعي التوليدي الداخلي Gennai للمساعدة في إعداد وثائق إجابات البرلمان، بينما يدافع المسؤولون عن سير العمل أمام الانتقادات. قال الوزير الرقمي Matsumoto إن Gennai يمكنه تحديد الأنظمة ذات الصلة والإجابات السابقة، مع استمرار الموظفين في تعديل المخرجات وفحص الحقائق قبل وصولها إلى الوزير. الاختبار العملي هو ما إذا كانت الأداة ستخفف العمل البيروقراطي الليلي من دون تحويل الإجابات البرلمانية إلى مخرجات ذكاء اصطناعي غير مدققة.

هبوط SoftBank يبين أثر تكاليف بنية الذكاء الاصطناعي على أسهم التقنية الآسيوية
الذكاء الاصطناعي

هبوط SoftBank يبين أثر تكاليف بنية الذكاء الاصطناعي على أسهم التقنية الآسيوية

تراجعت SoftBank Group بأكثر من 12% مع بيع أسهم التقنية الآسيوية، وسط ضغط مرتبط بتكاليف بنية الذكاء الاصطناعي وضعف Arm ومخاوف أسعار أشباه الموصلات.

Grep تضيف وكيل LLM إلى Monito مع تحول مراقبة الاختبارات نحو مراجعة السياق
الذكاء الاصطناعي

Grep تضيف وكيل LLM إلى Monito مع تحول مراقبة الاختبارات نحو مراجعة السياق

قالت Grep إن منتج Monito لمراقبة الاختبارات عبر الإنترنت يستخدم الآن وكيل LLM لتحليل السياق حول الأحداث المشتبه بها. وذكرت الشركة اختبارات داخلية أظهرت تقليص وقت المراجعة بعد الاختبار بأكثر من 30% وخفض التنبيهات الخاطئة بنحو 20%. وتبقى القضية الرئيسية هي ما إذا كانت المراقبة المعتمدة على الوكلاء تستطيع تحسين الكفاءة مع الحفاظ على الحكم البشري النهائي وعدالة المرشحين.

التالي

المزيد من الأخبار

كل الأخبار
أسعار الذاكرة تخفض شحنات PC في US بنسبة 7%الرقائق وأشباه الموصلات2 يوليو 2026أسعار الذاكرة تخفض شحنات PC في US بنسبة 7%أظهرت بيانات Omdia التي أوردتها Tom Hardware أن شحنات PC في US هبطت إلى 15.8 million وحدة في الربع الأول من 2026، مع ضغط نقص شرائح الذاكرة والتخزين على الحواسيب المحمولة منخفضة السعر ودفع السوق نحو انكماش متوقع بنسبة 14.4%.Cloudflare تحدد موعدا في سبتمبر لحظر زواحف AI متعددة الاستخدامالذكاء الاصطناعي2 يوليو 2026Cloudflare تحدد موعدا في سبتمبر لحظر زواحف AI متعددة الاستخدامتخطط Cloudflare لحظر زواحف الويب متعددة الاستخدام من الصفحات المدعومة بالإعلانات افتراضيا بدءا من 15 سبتمبر 2026، ما لم يغير مالك الموقع الإعداد. وتدفع السياسة شركات AI إلى فصل الوصول الخاص بالبحث عن استخدامات الوكلاء والتدريب، بينما توسع Cloudflare أدوات الدفع للناشرين.أسماء مستخدمي WhatsApp تخفي أرقام الهاتف لكن مخاطر الاحتيال تبقىالأمن السيبراني2 يوليو 2026أسماء مستخدمي WhatsApp تخفي أرقام الهاتف لكن مخاطر الاحتيال تبقىيطرح WhatsApp أسماء مستخدمين ومفاتيح اختيارية لتقليل كشف أرقام الهاتف، لكن باحثين أمنيين يحذرون من أن انتحال الهوية والهندسة الاجتماعية يمكن أن ينتقلا إلى المعرفات وصور الحسابات والحسابات التي تبدو موثوقة.Starlink تخفض خطط Memphis وسط نزاع مركز بيانات xAIالسحابة ومراكز البيانات2 يوليو 2026Starlink تخفض خطط Memphis وسط نزاع مركز بيانات xAIتقدم SpaceX خصومات Starlink قرب مراكز بيانات Colossus التابعة لـ xAI في Memphis وSouthaven، بينما تبقي الدعاوى ونزاعات التصاريح الانتباه على الطاقة والضوضاء ومزاعم التلوث حول موقع الذكاء الاصطناعي.AMD تستبدل HBM بـ LPDDR5X في حزمة ذاكرة Versal الجديدةالرقائق وأشباه الموصلات2 يوليو 2026AMD تستبدل HBM بـ LPDDR5X في حزمة ذاكرة Versal الجديدةتنقل AMD شرائح Versal Premium Gen 2 Memory on Package adaptive SoCs من HBM إلى LPDDR5X بعد أن دفعت قيود إمداد HBM2e عائلة Versal HBM السابقة نحو الإيقاف.مهلة MiCA تجبر شركات الكريبتو في الاتحاد الأوروبي على الترخيص أو الخروجالعملات المشفرة وويب32 يوليو 2026مهلة MiCA تجبر شركات الكريبتو في الاتحاد الأوروبي على الترخيص أو الخروجأصبح إطار MiCA في الاتحاد الأوروبي نافذا بالكامل، ما يلزم شركات الكريبتو التي تخدم التكتل المكون من 27 دولة بالحصول على ترخيص أو وقف التشغيل. وقال محامون وتنفيذيون إن القواعد تمنح وضوحا أكبر، لكنهم حذروا من أن تكاليف الامتثال قد تقلص نحو 3,000 مزود مسجل إلى 300 أو 400 شركة مرخصة.UAE تمنح منصات التواصل 12 شهرا لتطبيق قواعد دون 15 عامارأس المال والسياسات2 يوليو 2026UAE تمنح منصات التواصل 12 شهرا لتطبيق قواعد دون 15 عاماتقول UAE إن منصات التواصل الاجتماعي يجب أن تبني ضوابط فعالة للتحقق من العمر بعد قرار Cabinet يقيّد وصول من هم دون 15 عاما. وتملك شركات التكنولوجيا 12 شهرا قبل تطبيق العقوبات، وقال مسؤولون إن بيانات التحقق من العمر يجب أن تحذف فورا بدلا من تخزينها لدى المنصات.Robinhood تطلق Chain على Arbitrum وتتيح Stock Tokens في أكثر من 120 دولةالتقنية المالية والمدفوعات الرقمية2 يوليو 2026Robinhood تطلق Chain على Arbitrum وتتيح Stock Tokens في أكثر من 120 دولةأطلقت Robinhood الشبكة الرئيسية العامة لـ Robinhood Chain، وهي Layer 2 مبنية على Arbitrum، وجعلت Stock Tokens متاحة عبر Robinhood Wallet في أكثر من 120 دولة. كما قدمت الشركة Robinhood Earn بعائد تقديري 7% على USDG، لكن توافر المنتج حسب الولاية وضوابط التحكم يبقيان من القيود الأساسية.Nvidia تسمي خطة بنية AI أمريكية بقيمة 500 مليار دولار وتترك الجدول مفتوحاالسحابة ومراكز البيانات2 يوليو 2026Nvidia تسمي خطة بنية AI أمريكية بقيمة 500 مليار دولار وتترك الجدول مفتوحاتقول Nvidia إنها وشركاء من بينهم TSMC وFoxconn وWistron وCorning وLumentum وCoherent وAmkor يخططون لإنتاج بنية AI تحتية في الولايات المتحدة تصل قيمتها إلى 500 مليار دولار. ويستند الحساب إلى مدونة Nvidia الخاصة؛ فهو يسمي مصانع وموردين وأرقام وظائف، لكنه لا يقدم جدولا كاملا للإنتاج.AWS تعلن وحدة هندسة AI ميدانية بقيمة 1 مليار دولارالذكاء الاصطناعي2 يوليو 2026AWS تعلن وحدة هندسة AI ميدانية بقيمة 1 مليار دولارأعلنت AWS وحدة Forward Deployed Engineering بقيمة 1 مليار دولار لإرسال فرق هندسية صغيرة إلى بيئات العملاء لنحو 45 يوما. وذكرت TheStreet أن المستخدمين الأوائل يشملون Allen Institute وCox Automotive وNBA وNFL وRicoh وSouthwest Airlines.مجلس Meta يدرس منشورات مؤيدة لإيران بقيت على المنصاتالسياسة2 يوليو 2026مجلس Meta يدرس منشورات مؤيدة لإيران بقيت على المنصاتقد يدرس Oversight Board التابع لـ Meta ما إذا كان ينبغي لـ Facebook وInstagram إزالة منشورين مؤيدين لإيران أبلغ عنهما المستخدمون كسلوك غير أصيل منسق محتمل مرتبط بعمليات تأثير ترعاها دولة.قرارات الرفض العلنية من OCC ترفع مخاطر تراخيص شركات fintechالتقنية المالية والمدفوعات الرقمية2 يوليو 2026قرارات الرفض العلنية من OCC ترفع مخاطر تراخيص شركات fintechتخطط OCC لنشر قرارات رفض طلبات التراخيص المصرفية، ما يمنح شركات fintech ومقدمي طلبات البنوك الرقمية رؤية أوضح لأسباب فشل الملفات. وترفع الإرشادات أيضا التكلفة السمعة للتقديم قبل جاهزية أنظمة الحوكمة والامتثال والمخاطر.