Google تختبر الطلب على الذكاء الاصطناعي المحلي مع إطلاق Gemma 4 12B

بقلممكتب الذكاء الاصطناعي والمؤسسات في SendTech Timesتغطية مكتبية محررة ومراجعة المصدر|المصدر: Venturebeat

موجز التحرير

أطلقت Google نموذج Gemma 4 12B بوصفه نموذجاً متعدد الوسائط مفتوح الأوزان مصمماً للعمل محلياً على حاسوب مؤسسي عادي. يُوصف النموذج بأنه يضم 11.95 مليار معلمة، ويعمل بترخيص Apache 2.0، ويستهدف ذاكرة 16GB، ويدعم نافذة سياق 256K، ومتاح فوراً عبر Google AI Edge Gallery. الاختبار العملي هو ما إذا كانت المؤسسات ستستخدم الاستدلال متعدد الوسائط المحلي عندما تكون قيود الاتصال السحابي أو زمن الاستجابة أو التعامل مع البيانات عاملاً حاسماً.

تمت المراجعة مقابل مواد المصدرتحرير مكتب الذكاء الاصطناعي والمؤسسات في SendTech Times

Google تختبر الطلب على الذكاء الاصطناعي المحلي مع إطلاق Gemma 4 12B

مصدر الصورة: VentureBeat / OpenAI ChatGPT-Images-2.0

الذكاء الاصطناعي متعدد الوسائط المحلي يدخل دائرة الاهتمام

أطلقت Google نموذج Gemma 4 12B بوصفه نموذجاً متعدد الوسائط مفتوح الأوزان يستهدف مستخدمي المؤسسات الذين يريدون تشغيل أنظمة الذكاء الاصطناعي محلياً بدلاً من الاعتماد الكامل على الاستدلال السحابي.

يُوصف النموذج بأنه نظام يضم 11.95 مليار معلمة ويعمل بموجب ترخيص Apache 2.0. وهو محسّن للعمل على حاسوب مؤسسي عادي باستخدام 16GB من ذاكرة VRAM أو الذاكرة الموحدة، ومتاح فوراً للتنزيل عبر Google AI Edge Gallery.

يمنح ذلك الإصدار زاوية عملية للمؤسسات: فقد يكون الاستدلال المحلي مهماً عندما تحتاج الفرق إلى العمل دون اتصال، أو تقليل الاعتماد على السحابة، أو إبقاء بعض أحمال الذكاء الاصطناعي أقرب إلى الجهاز. لم تُذكر أسماء عملاء مؤسسيين أو عمليات نشر أو أحجام شحن للنموذج، لذلك تظل الإشارة التجارية في مرحلة مبكرة.

لماذا تهم البنية التقنية

يستخدم Gemma 4 12B بنية "Unified" خالية من المشفرات لمدخلات الصوت والرؤية. ويقوم النموذج بإسقاط الرقع البصرية والموجات الصوتية الخام مباشرة في فضاء التضمين الخاص بنموذج اللغة الكبير عبر طبقات خطية خفيفة، بدلاً من استخدام وحدات تشفير منفصلة.

يُعرض مسار الرؤية بوصفه وحدة تضم 35 مليون معلمة وتستخدم عملية ضرب مصفوفية واحدة، بينما تتم إزالة مشفر الصوت بالكامل. وبالنسبة إلى فرق الهندسة في المؤسسات، تتمثل الفائدة المعلنة في خفض زمن الاستجابة وتقليل متطلبات الذاكرة لأحمال العمل متعددة الوسائط. ويجب التعامل مع هذه الادعاءات باعتبارها ادعاءات مرتبطة بالنموذج وليست بيانات أداء مؤسسية مثبتة بشكل مستقل.

يتضمن النموذج أيضاً نافذة سياق بحجم 256K رمز، وقدرات أصلية لاستخدام الأدوات، ودعماً لموجهات النظام، ووضعاً للتفكير خطوة بخطوة. وتجعل هذه الخصائص الإصدار ذا صلة ببرمجيات الوكلاء، وتحليل الوثائق الطويلة، ومستودعات الشيفرة، وسير عمل تفريغ الاجتماعات.

يقع النموذج بين أنظمة الحافة المحمولة والبنية الأثقل لمراكز البيانات. ويهم هذا التمييز المشترين الذين يحتاجون إلى قدرة متعددة الوسائط كافية للاستخدام الداخلي الخاضع للسيطرة، لكنهم لا يريدون أن يعتمد كل سير عمل على نقطة نموذج بعيدة.

اختبار التبني

يشير الإصدار إلى سؤال أضيق لكنه مهم في سوق الذكاء الاصطناعي المؤسسي: هل تستطيع النماذج متعددة الوسائط الأصغر والمفتوحة الأوزان تغطية قدر كافٍ من العمل لتقليل الاعتماد على بنية مراكز البيانات الأثقل.

لا يُقدَّم Gemma 4 12B بديلاً للنماذج السحابية الأكبر. فقيمته أكثر تحديداً: يمنح المطورين خياراً آخر عندما تكون الخصوصية أو الاستخدام دون اتصال أو زمن الاستجابة أو النشر على مستوى الجهاز أهم من الحد الأقصى لحجم النموذج.

الإشارة التالية هي ما إذا كان مطورو المؤسسات سينتقلون من التجربة إلى عمليات نشر فعلية على الحواسيب المحمولة أو أجهزة الحافة أو الأنظمة الداخلية الخاضعة للسيطرة. ومن دون عملاء مسمين، يبقى الإصدار أولاً محطة تقنية ولا يتحول إلى قصة تبنٍ سوقي إلا إذا تبعه استخدام فعلي.

#ذكاء_اصطناعي_للمؤسسات #البنية_التحتية_للذكاء_الاصطناعي #السحابة

مقالات ذات صلة

المزيد

الذكاء الاصطناعي

مسؤولو Linux Foundation يسمون MCP إطارا لأدوات الذكاء الاصطناعي المؤسسية

وصف مسؤولون في Linux Foundation بروتوكول MCP كطبقة تنسيق تربط نماذج الذكاء الاصطناعي بالأدوات والذاكرة والبيانات الخاصة، مع بقاء قوائم السجلات المعتمدة ونتائج الإنتاج خارج السجل العلني.

الذكاء الاصطناعي

رهان CoRover على الذكاء الاصطناعي دون اتصال يختبر جدوى النشر الطرفي في الهند

تطرح CoRover AI النشر على الجهاز وداخل المؤسسة كحل عملي للبنوك والمستشفيات والدفاع والبنية الريفية، إذ يرى الرئيس التنفيذي Ankush Sabharwal أن النماذج الأضيق قد ترفع الاعتمادية عندما تصبح السحابة أو الامتثال أو زمن الاستجابة قيودا تشغيلية.

الذكاء الاصطناعي

Tencent تطرح وكيل WorkBuddy عالمياً ضمن دفعها لإنتاجية المؤسسات

أطلقت Tencent Cloud وكيل WorkBuddy للمستخدمين خارج الصين بعد طرحه محلياً. يستطيع المنتج تشغيل مهام عبر تطبيقات المراسلة والاتصال بأدوات عمل مثل GitHub وJira وGoogle Drive وGmail وNotion وSlack. كما طرحت الشركة Miora وTokenHub ضمن توسع أوسع في ذكاء المؤسسات.

الذكاء الاصطناعي

ندرة حوسبة الذكاء الاصطناعي تعيد رسم خريطة البنية التحتية

تُظهر مشاريع البنية التحتية للذكاء الاصطناعي في الهند وأفريقيا والبرازيل والإمارات كيف تدفع الطاقة، وإمكانية الوصول إلى الشرائح، وموقع البيانات، والطلب على الاستدلال، الحوسبة إلى ما هو أبعد من خريطة السحابة فائقة التوسع التقليدية في الولايات المتحدة.

الذكاء الاصطناعي

إدراج E2E Networks في BSE يضع بناء سحابة AI الهندية ضمن اختبار السوق العامة

بدأت E2E Networks التداول في BSE Mainboard بعد موافقة على 20.56 Cr سهم، ما يربط قصة بنية AI السحابية في الهند بسعة GPU ومنصة TIR ونمو إيرادات Q4 FY26.

الرقائق وأشباه الموصلات

شريحة Teralynx T100 من Marvell تدفع تبديل مراكز بيانات الذكاء الاصطناعي إلى سباق الرقائق

أعلنت Marvell عن الإتاحة المخططة لشريحة التبديل Teralynx T100 الموجهة لبنية تدريب واستدلال الذكاء الاصطناعي. تعمل الشريحة بسرعة 102.4 Tbps، وتستخدم تقنية تصنيع 3nm، وتدعم ما يصل إلى 512 منفذاً، وتقول الشركة إنها تستهلك طاقة أقل بنسبة 25 percent من الحلول المنافسة. الاختبار العملي هو ما إذا كان عملاء مراكز البيانات سيستخدمون التبديل عالي الكثافة والأقل استهلاكاً للطاقة لتخفيف قيود الكمون والطاقة في عناقيد الذكاء الاصطناعي الأكبر.