SendTech Times
News
AI SHIFT:

Gemini-SQL2 من Google يضع دقة تحويل اللغة الطبيعية إلى SQL أمام اختبار المؤسسات

ملخص المقال

تقول Google إن Gemini-SQL2 حقق دقة تنفيذ 80.04% على معيار BIRD، لكن الفجوة مع الخبراء البشر تبقي التقنية ضمن سير عمل خاضع للمراجعة لا كطبقة استعلام بيانات مستقلة بالكامل.

Gemini-SQL2 من Google يضع دقة تحويل اللغة الطبيعية إلى SQL أمام اختبار المؤسسات
مصدر الصورة: AI Times Korea

واجهة قواعد بيانات مبنية حول التنفيذ

قدمت Google تقنية Gemini-SQL2 كقدرة text-to-SQL تحول الأسئلة المكتوبة باللغة الطبيعية إلى استعلامات قواعد بيانات قابلة للتنفيذ. تعتمد التقنية على Gemini 3.1 Pro وتستهدف مشكلة مألوفة في المؤسسات: يستطيع مستخدمو الأعمال وصف الإجابة التي يحتاجون إليها، لكن قاعدة البيانات ما زالت تحتاج إلى SQL دقيق يربط الجداول ويتعامل مع التواريخ ويعيد النتيجة الصحيحة.

الفارق المهم هو التنفيذ. لا يجري تقديم Gemini-SQL2 كمساعد يكتب استعلامات تبدو سليمة شكليا فقط. في معيار BIRD يجب أن يعمل الاستعلام المولد على قاعدة البيانات وأن يطابق نتيجة SQL المرجعي. قالت Google إن Gemini-SQL2 حقق دقة تنفيذ 80.04% في فئة Single Trained Model ضمن BIRD، متجاوزا نتيجة Gemini-SQL السابقة البالغة 76.13% التي كُشف عنها في November 2025.

هذا يجعل الإعلان قصة عن منتجات البيانات، لا مجرد ادعاء لأداء نموذج. إذا كانت واجهات اللغة الطبيعية ستدخل أدوات التحليلات أو أنظمة المالية أو منصات المطورين، فالمقياس المفيد هو ما إذا كان الاستعلام يعطي الإجابة الصحيحة عند التعامل مع بيانات غير مرتبة.

BIRD يوضح صعوبة SQL داخل المؤسسات

صُمم BIRD ليدفع أنظمة text-to-SQL إلى التعامل مع تعقيد يشبه بيئات المؤسسات. يضم المعيار 95 قاعدة بيانات و37 مجالا مهنيا و12,751 زوجا من الأسئلة وSQL، بحجم بيانات إجمالي يبلغ 33.4GB. كما يتضمن بيانات غير مكتملة ومتطلبات معرفة خارجية، وهي نقاط فشل شائعة عندما يحاول نموذج تفسير طلب تجاري.

هذه الشروط مهمة لأن مستخدمي المؤسسات نادرا ما يطرحون أسئلة قواعد البيانات بلغة مخطط واضحة. قد يطلب مدير إيرادات حساب الإيراد الشهري المتكرر حسب المنطقة للعملاء الذين غادروا خلال 90 days بعد ترقية. تحويل ذلك إلى SQL قد يتطلب عمليات ربط ودوال نافذة ومنطق تواريخ. وقد يصف مهندس بيانات عملية تحويل بلغة عادية، ثم يراجع BigQuery SQL المولد قبل استخدامه في خط إنتاج بيانات.

تشير نتيجة Gemini-SQL2 إلى تحسن في التعامل مع هذا النوع من سير العمل، لكنها لا تلغي التحقق. مستوى الخبراء البشر المذكور في BIRD يبلغ 92.96%، ما يترك فجوة قدرها 12.9 percentage points. كما أن دقة حول مستوى 80% تعني وجود خطر أخطاء كاف لفرض المراجعة والاختبار وضوابط الصلاحيات حول الاستعلامات المولدة في فرق التحليلات الإنتاجية.

التدريب المتخصص ما زال مهما

تشير مقارنة Google أيضا إلى نمط تقني مهم. بعض نماذج SQL المتخصصة عند مستوى 32-billion-parameter تفوقت على نماذج لغة عامة متقدمة في أعمال قواعد البيانات. ويدعم ذلك درسا أضيق في AI المؤسسي: القدرة اللغوية الواسعة لا تكفي دائما عندما تكون المهمة مقيدة ببنية المخطط وقواعد التنفيذ وتقاليد البيانات الخاصة بكل مجال.

لا توصف Gemini-SQL2 بأنها نموذج مستقل منفصل. إنها قدرة مبنية على Gemini 3.1 Pro، ولذلك يصبح السؤال المنتج هو أين ستضعها Google. الأماكن المرجحة هي واجهات توليد SQL القائمة على Gemini مثل BigQuery Studio وAlloyDB AI وCloud SQL Studio، رغم أن Google لم تكشف بعد عن API منفصل أو model string خاص بـ Gemini-SQL2.

الاختبار التالي هو التحكم في المنتج

أقوى استخدام قريب المدى هو المساعدة الخاضعة للإشراف. يمكن لشركات SaaS التي تقدم ميزات Ask Your Data وفرق التحليلات المؤسسية ومجموعات هندسة البيانات استخدام النظام لتقليل المسافة من السؤال إلى مسودة الاستعلام. أما مشكلة التحكم المتبقية فهي تحديد متى يمكن الوثوق بـ SQL المولد، ومتى يحتاج إلى مراجعة بشرية، ومقدار الوصول الذي ينبغي أن يحصل عليه النموذج إلى بيانات إنتاجية حساسة.

هنا تتحول نتيجة المعيار إلى سؤال نشر. يحسن Gemini-SQL2 حجة واجهات قواعد البيانات باللغة الطبيعية، لكن الأرقام المدعومة من المصدر ما زالت تشير إلى تصميم يبقي الإنسان داخل الحلقة. وإلى أن تضيق فجوة الدقة أكثر، فإن القيمة العملية هي تسريع بناء الاستعلام مع المراجعة، لا أتمتة قواعد البيانات من دون إشراف.

شارك هذا المقال
inXf

مقالات ذات صلة

المزيد
Pramaana Labs تجمع 27 مليون دولار لجعل إجابات الذكاء الاصطناعي قابلة للإثبات
الذكاء الاصطناعي

Pramaana Labs تجمع 27 مليون دولار لجعل إجابات الذكاء الاصطناعي قابلة للإثبات

جمعت Pramaana Labs، المسجلة في Bengaluru، تمويلاً بذرياً بقيمة 27 مليون دولار بقيادة Khosla Ventures لبناء طبقة تحقق لأنظمة الذكاء الاصطناعي في قطاعات منظمة مثل الضرائب والقانون والتمويل والرعاية الصحية. وتقول الشركة إن نظامها يحول الأسئلة إلى صيغ رسمية، يشغل محرك إثبات، ويرفض الإجابة إذا تعذر إثبات صحتها.

Alibaba تطلق Qwen-Robot لاختبار الذكاء الاصطناعي المجسد في الملاحة والمناولة
الذكاء الاصطناعي

Alibaba تطلق Qwen-Robot لاختبار الذكاء الاصطناعي المجسد في الملاحة والمناولة

أطلقت Alibaba عائلة Qwen-Robot للذكاء الاصطناعي المجسد، وتشمل نماذج للملاحة والمناولة ونمذجة العالم المادي. وتعرض الشركة Qwen-RobotNav على روبوت Unitree Go2 بكاميرا منخفضة الدقة واحدة، لكن الدليل المتاح يبقى أقرب إلى عرض تقني منه إلى نشر تجاري واسع.

تمويل AutoVRse يضع بنية التدريب الصناعي بالذكاء الاصطناعي في الهند تحت اختبار المستثمرين
الذكاء الاصطناعي

تمويل AutoVRse يضع بنية التدريب الصناعي بالذكاء الاصطناعي في الهند تحت اختبار المستثمرين

جمعت AutoVRse تمويلا قدره $2.4 Mn من Singularity AMC وLumikai، ما يمنح شركة التدريب المؤسسي بتقنيات AR/VR في India رأسمالا جديدا للتوسع في North America وEurope مع إعلانها عن أكثر من 50 عميلا مؤسسيا.

Adobe تضع مساعدين بالذكاء الاصطناعي داخل Creative Cloud والاختبار هو التحكم
الذكاء الاصطناعي

Adobe تضع مساعدين بالذكاء الاصطناعي داخل Creative Cloud والاختبار هو التحكم

تطرح Adobe مساعدين بالذكاء الاصطناعي في نسخة beta عامة داخل Photoshop وPremiere وIllustrator وInDesign وFrame.io. يدفع الإطلاق التحرير بالمحادثة إلى أدوات إبداعية رئيسية، لكن التبني سيتوقف على ثقة المحترفين في استخدام المساعدين داخل العمل الحقيقي.

التالي

المزيد من الأخبار

كل الأخبار
NymCard تطرح منصة موحدة لبنوك MENA العالقة بين أنظمة دفع متفرقةالرقائق وأشباه الموصلات19 يونيو 2026NymCard تطرح منصة موحدة لبنوك MENA العالقة بين أنظمة دفع متفرقةأطلقت NymCard في دبي منصة nCore FullStack التي تجمع إصدار البطاقات والإقراض وحركة الأموال والتسوية ومكافحة الجرائم المالية والمطابقة التشغيلية عبر تكامل واحد. وتقول الشركة إن المنصة تعمل على السحابة العامة أو النماذج الهجينة أو داخل الدولة أو داخل مقرات البنوك، مع خدمة أكثر من 60 بنكاً وشركة مالية ومؤسسة في ثمانية أسواق.Claros تختبر رقائق طاقة الذكاء الاصطناعي عبر Samsung Foundryالرقائق وأشباه الموصلات19 يونيو 2026Claros تختبر رقائق طاقة الذكاء الاصطناعي عبر Samsung Foundryتقول Claros إن Samsung Electronics ستصنع منظم الجهد المتكامل IVR في مصنع Austin بولاية Texas، ما يمنح الشركة مسار إنتاج أمريكياً لرقائق تهدف إلى تقليل فقد الطاقة قرب معالجات الذكاء الاصطناعي ودعم تصميمات مراكز البيانات 800 VDC.خطة FedNow العابرة للحدود تضع المدفوعات الفورية أمام اختبار الامتثالالتقنية المالية والمدفوعات الرقمية19 يونيو 2026خطة FedNow العابرة للحدود تضع المدفوعات الفورية أمام اختبار الامتثاليريد Federal Reserve السماح لمشاركي FedNow باستخدام وسطاء من خارج Federal Reserve في التحويلات العابرة للحدود، وهو تغيير تؤيده شركات fintech لكنه ما زال مرتبطاً بفحص العقوبات ورموز الرسائل وجاهزية البنوك.مشروع DataVolt في Uzbekistan يختبر توسع مراكز البيانات السعودية خارج الخليجالسحابة ومراكز البيانات19 يونيو 2026مشروع DataVolt في Uzbekistan يختبر توسع مراكز البيانات السعودية خارج الخليجتطور DataVolt السعودية مركز البيانات TAS-1 بقدرة 12MW في Tashkent بعد تأمين تمويل بقيمة $150 million، بينما تبقى السعات الأكبر في Uzbekistan مرتبطة باتفاقات أولية وخطط استثمار مستقبلية.HKEX وHKMA يضعان e-HKD في اختبار حي لمدفوعات الهامشالتقنية المالية والمدفوعات الرقمية19 يونيو 2026HKEX وHKMA يضعان e-HKD في اختبار حي لمدفوعات الهامشتختبر HKEX وHong Kong Monetary Authority استخدام e-HKD في مدفوعات هامش المشتقات بعد ساعات التداول، في حالة استخدام wholesale CBDC مرتبطة بعمليات سوق حية وليست تجربة دفع تجزئة.Brazos من Google يستهدف مشكلة تبريد AI داخل مراكز البيانات القائمةالسحابة ومراكز البيانات19 يونيو 2026Brazos من Google يستهدف مشكلة تبريد AI داخل مراكز البيانات القائمةقدمت Google نظام Brazos، وهو sidecar مفتوح المصدر للتبريد liquid-to-air في مراكز البيانات air-cooled القائمة، مع حمل حراري اسمي 60kW لكل rack ودعم racks من نوع OCP ORv3.IFC تدعم مراكز بيانات Sify في India بحزمة $371 Mnالسحابة ومراكز البيانات19 يونيو 2026IFC تدعم مراكز بيانات Sify في India بحزمة $371 Mnالتزمت IFC بحزمة $371 Mn لصالح Sify Infinit Spaces Ltd. لبناء مركزين للبيانات جاهزين لـ AI في Navi Mumbai وChennai، في إشارة تمويل جديدة لبنية cloud في India.Alibaba Cloud تضيف سعة في طوكيو مع ارتفاع طلب اليابان على الذكاء الاصطناعيالسحابة ومراكز البيانات19 يونيو 2026Alibaba Cloud تضيف سعة في طوكيو مع ارتفاع طلب اليابان على الذكاء الاصطناعيافتتحت Alibaba Cloud مركز بياناتها الخامس في اليابان وأتاحت منصة Model Studio داخل البلاد. يمنح التوسع الشركات اليابانية وصولاً محلياً إلى Qwen3.7-Plus وخدمات قواعد بيانات أصلية للذكاء الاصطناعي وبصمة سحابية إقليمية أكبر.صفقة Policloud السحابية تضع وحدات GPU في مواقع طاقة متجددةالسحابة ومراكز البيانات19 يونيو 2026صفقة Policloud السحابية تضع وحدات GPU في مواقع طاقة متجددةحصلت Policloud على عقد إطاري بقيمة €580 million مع CloudGrid Energy لنشر 280 وحدة معيارية و29,000 وحدة GPU وقدرة حوسبة قدرها 35MW عبر 16 موقعاً أوروبياً بحلول نهاية 2027.Northslope تختار أبوظبي لبناء حضورها الخليجي في الذكاء الاصطناعيالذكاء الاصطناعي18 يونيو 2026Northslope تختار أبوظبي لبناء حضورها الخليجي في الذكاء الاصطناعيافتتحت Northslope أول مكتب لها في الخليج داخل أبوظبي بعد تكوين فريق من six مهندسين في الإمارات. تقرّب هذه الخطوة شركة برمجيات الذكاء الاصطناعي المرتبطة بمؤسسيها السابقين في Palantir من عملاء إقليميين في اللوجستيات وإدارة الأصول والطاقة والتصنيع والطيران.SK hynix ترسل عينات HBM4E واختبار الحجم ما زال أمام مشتري ذاكرة الذكاء الاصطناعيالرقائق وأشباه الموصلات18 يونيو 2026SK hynix ترسل عينات HBM4E واختبار الحجم ما زال أمام مشتري ذاكرة الذكاء الاصطناعيأرسلت SK hynix عينات HBM4E من 12 طبقة إلى عملاء رئيسيين، مع سرعة 16Gbps لكل دبوس وسعة 48GB في الحزمة. تنقل الخطوة سباق ذاكرة الذكاء الاصطناعي من المواصفات إلى تأهيل العملاء وتوقيت الإنتاج.مراكز البيانات تواجه اختباراً مناخياً وخريطة المخاطر غير متوازنةالسحابة ومراكز البيانات18 يونيو 2026مراكز البيانات تواجه اختباراً مناخياً وخريطة المخاطر غير متوازنةتضع دراسة First Street نحو 79% من قدرة مراكز البيانات العالمية ضمن مخاطر مرتفعة من أخطار مناخية حادة. تجعل النتائج المرونة والوصول إلى الطاقة وأنظمة المياه جزءاً من اختبار بناء بنية الذكاء الاصطناعي التحتية.