SendTech Times
الذكاء الاصطناعيAnalysis|1 يونيو 2026 في 08:11 ص
CAPACITY TEST:

Om AI تراهن على نماذج متعددة الوسائط على الحافة مع تحول شركات الذكاء الاصطناعي الصينية نحو النشر العملي

ملخص المقال

تركز Om AI Technology على نماذج رؤية متعددة الوسائط صغيرة تعمل على الحافة لأجهزة الكمبيوتر والكاميرات والروبوتات وغيرها، بدلاً من النماذج السحابية الضخمة. عرضت الشركة خلال BEYOND Expo 2026 منتج OttoBox AI Studio، وهو أداة محتوى تعتمد على الذكاء الاصطناعي المحلي لتحليل الفيديو ومطابقة الأصول وتوليد النصوص والإنتاج السريع. الاختبار التالي هو ما إذا كان نموذج VLX متعدد الوسائط على الحافة سيحسن فهم الفيديو واتخاذ القرار مع خفض تكاليف التشغيل.

Om AI تراهن على نماذج متعددة الوسائط على الحافة مع تحول شركات الذكاء الاصطناعي الصينية نحو النشر العملي
مصدر الصورة: TechNode

إشارة النشر العملي

تتموضع Om AI Technology حول الذكاء الاصطناعي على الحافة في وقت تنتقل فيه منافسة النماذج الصينية من الحجم إلى النشر العملي. وذكرت TechNode أن الشركة، التي تأسست في 2021، لا تعطي الأولوية للنماذج السحابية شديدة الضخامة. وبدلاً من ذلك، تبني نماذج رؤية متعددة الوسائط عامة يمكن تشغيلها بالقرب من الأجهزة النهائية مثل أجهزة الكمبيوتر والكاميرات والروبوتات.

وخلال يوم الإعلام في BEYOND Expo 2026، عرضت Om AI منتج OttoBox AI Studio، وهو منتج إنشاء محتوى مصمم لعصر الذكاء الاصطناعي ويستهدف العاملين في الإعلام وصناع المحتوى. يستخدم المنتج القدرة الحاسوبية المحلية لدعم تحليل الفيديو، ومطابقة أصول المحتوى، وإنشاء النصوص، وتسريع إنتاج الفيديو. وتشير هذه الخطوة إلى أن Om AI تحاول جعل الذكاء الاصطناعي متعدد الوسائط مفيداً في سير عمل تكون فيه الكمون والتكلفة ومعالجة البيانات عوامل مهمة.

لماذا يهم ذلك

تتبع الشركة مساراً تقوده الصناعة بدلاً من البدء بنموذج عام ثم البحث عن تطبيقات. وقالت TechNode إن الفريق يمتلك خبرة عميقة في الإعلام والعمل السمعي البصري، وترى Om AI أن هذه الخلفية توفر مشكلات إنتاج حقيقية وبيانات تشغيلية أعلى جودة.

ويهم هذا التركيز لأن ذكاء الفيديو قد يكون مكلفاً عندما يعتمد على نماذج كبيرة وموارد GPU سحابية. وتركز Om AI بدلاً من ذلك على نماذج أصغر وأسرع تعمل على الحافة. وإذا نجح هذا النهج، فقد تتمكن الشركات من تحليل الفيديو على الأجهزة المحلية، وخفض تكاليف الاستدلال، وتقليل الحاجة إلى رفع بيانات حساسة. وقد تكون هذه العوامل مهمة للمستخدمين المؤسسيين الذين يهتمون بالخصوصية والأمن وتوقع تكاليف التشغيل.

حالات استخدام الذكاء الاصطناعي على الحافة

ذكرت TechNode أن Om AI تركز على فهم الفيديو بنماذج منخفضة المعلمات. وتقول الشركة إن نماذجها يمكن أن تحقق سرعة استدلال على مستوى أجزاء من الألف من الثانية، وهو ما تقدمه كميزة لاستخدامات فورية تشمل الأمن والتفتيش الصناعي وتحليلات AIoT.

وتقول الشركة أيضاً إن أعمالها في الذكاء الاصطناعي تغطي أجهزة AI PC وAIoT والذكاء المجسد. وتستخدم نماذجها في الروبوتات والكلاب الروبوتية والطائرات المسيرة، ولديها تعاونات مع Apple وLenovo وHP، وفقاً للمصدر. كما أقام الإصدار الرئيسي من OttoBox AI Studio شراكات مع شركات رائدة في تصنيع أجهزة الكمبيوتر، منها Apple وLenovo وHP، لنشره في مساحة حواسيب الذكاء الاصطناعي.

زاوية المنتج والإتاحة

لا تستهدف Om AI أسواق المؤسسات والأجهزة فقط. فقد وصف المصدر أيضاً تطبيق Homer App، وهو منتج مصمم للمستخدمين من ذوي الإعاقة البصرية. ويمكنه دعم البحث عن الأشياء والملاحة المساعدة عبر الهواتف الذكية أو نظارات الذكاء الاصطناعي.

وتوضح هذه الحالة سبب إمكانية امتلاك الذكاء الاصطناعي متعدد الوسائط قيمة تتجاوز إنتاج المحتوى. والسؤال الأساسي هو ما إذا كانت نماذج الحافة تستطيع فهم الفيديو والصوت والنص معاً بما يكفي لدعم قرارات فورية في السيناريوهات الاستهلاكية والصناعية والمساعدة.

ما الذي يجب مراقبته

الأولوية الاستراتيجية الرئيسية لدى Om AI هذا العام هي VLX، وهو نموذجها متعدد الوسائط من الجيل التالي على الحافة. وذكرت TechNode أن VLX يهدف إلى تحسين فهم الفيديو واتخاذ القرار مع الاستمرار في تقليل تكاليف التشغيل.

ينبغي مراقبة ما إذا كانت Om AI قادرة على تحويل استراتيجيتها في نماذج الحافة إلى عمليات نشر متكررة عبر أجهزة AI PC وAIoT والأجهزة المجسدة. والإشارة الأوسع في السوق هي أن شركات الذكاء الاصطناعي الصينية الناشئة قد تتنافس بشكل متزايد على التنفيذ والمعالجة المحلية وحالات الاستخدام الرأسية بدلاً من حجم النموذج وحده.

شارك هذا المقال
inXf

مقالات ذات صلة

المزيد
نوتا تشغل نموذج روبوتات VLA في الوقت الحقيقي على عتاد كوالكوم الطرفي
الذكاء الاصطناعي

نوتا تشغل نموذج روبوتات VLA في الوقت الحقيقي على عتاد كوالكوم الطرفي

عرضت نوتا تشغيل نموذج روبوتات يجمع بين الرؤية واللغة والفعل في الوقت الحقيقي على عتاد Qualcomm Dragonwing للذكاء الاصطناعي الطرفي. وخفضت الشركة زمن معالجة رأس الفعل من 218 ملي ثانية إلى 31 ملي ثانية مع بقاء معدل نجاح المهمة شبه ثابت. ويشير العرض إلى مسار لأنظمة الذكاء الاصطناعي الفيزيائي التي تعمل قرب الروبوتات بدلا من الاعتماد أساسا على خوادم GPU أو السحابة.

ByteDance تضع Doubao في قلب اندفاعها نحو الذكاء الاصطناعي في 2026
الذكاء الاصطناعي

ByteDance تضع Doubao في قلب اندفاعها نحو الذكاء الاصطناعي في 2026

قال الرئيس التنفيذي Liang Rubo إن ByteDance تجعل Doubao أو Dola AI محوراً رئيسياً لعام 2026، مع استمرار الاستثمار في المواهب والنماذج الأساسية وتطبيقات توليد الصور والفيديو رغم بقاء فجوة مع قادة الذكاء الاصطناعي عالمياً.

منصة Hitto تختبر توجه الصين نحو نماذج ذكاء اصطناعي متخصصة في الموسيقى
الذكاء الاصطناعي

منصة Hitto تختبر توجه الصين نحو نماذج ذكاء اصطناعي متخصصة في الموسيقى

تروج Ziyouliangji، التي تأسست في 2023، لمنصة Hitto كمنصة موسيقى بالذكاء الاصطناعي مبنية على نموذج موسيقي أساسي طورته الشركة. تستطيع المنصة توليد أغان من الجمل أو الصور أو المشاعر، بينما يضيف إصدار Hitto V3.0 تحسينات في الغناء وتوليد الألحان بالذكاء الاصطناعي. وسيكون الاختبار التالي هو ما إذا كانت حالات الاستخدام الاستهلاكية والتجارية ستخلق سلوكاً متكرراً يتجاوز حداثة التجربة الأولى.

نموذج WALL-WM من X-Square يدفع ذكاء الروبوتات نحو التخطيط على مستوى الحدث
الذكاء الاصطناعي

نموذج WALL-WM من X-Square يدفع ذكاء الروبوتات نحو التخطيط على مستوى الحدث

أطلقت X-Square Robot نموذج WALL-WM للذكاء الاصطناعي المجسد، وهو نموذج عالم يتنبأ بالأحداث الدلالية بدلا من الإطارات الحركية الثابتة. وتقول الشركة إن النهج يساعد الروبوتات على فهم هدف المهمة مثل الإمساك بجسم بدلا من حفظ تسلسلات حركة دقيقة. وتشير نتائج الاختبارات إلى أداء أقوى في جودة الحركة والاتساق الدلالي والمعقولية الفيزيائية وإنجاز المهام.