Om AI تراهن على نماذج متعددة الوسائط على الحافة مع تحول شركات الذكاء الاصطناعي الصينية نحو النشر العملي
تركز Om AI Technology على نماذج رؤية متعددة الوسائط صغيرة تعمل على الحافة لأجهزة الكمبيوتر والكاميرات والروبوتات وغيرها، بدلاً من النماذج السحابية الضخمة. عرضت الشركة خلال BEYOND Expo 2026 منتج OttoBox AI Studio، وهو أداة محتوى تعتمد على الذكاء الاصطناعي المحلي لتحليل الفيديو ومطابقة الأصول وتوليد النصوص والإنتاج السريع. الاختبار التالي هو ما إذا كان نموذج VLX متعدد الوسائط على الحافة سيحسن فهم الفيديو واتخاذ القرار مع خفض تكاليف التشغيل.
إشارة النشر العملي
تتموضع Om AI Technology حول الذكاء الاصطناعي على الحافة في وقت تنتقل فيه منافسة النماذج الصينية من الحجم إلى النشر العملي. وذكرت TechNode أن الشركة، التي تأسست في 2021، لا تعطي الأولوية للنماذج السحابية شديدة الضخامة. وبدلاً من ذلك، تبني نماذج رؤية متعددة الوسائط عامة يمكن تشغيلها بالقرب من الأجهزة النهائية مثل أجهزة الكمبيوتر والكاميرات والروبوتات.
وخلال يوم الإعلام في BEYOND Expo 2026، عرضت Om AI منتج OttoBox AI Studio، وهو منتج إنشاء محتوى مصمم لعصر الذكاء الاصطناعي ويستهدف العاملين في الإعلام وصناع المحتوى. يستخدم المنتج القدرة الحاسوبية المحلية لدعم تحليل الفيديو، ومطابقة أصول المحتوى، وإنشاء النصوص، وتسريع إنتاج الفيديو. وتشير هذه الخطوة إلى أن Om AI تحاول جعل الذكاء الاصطناعي متعدد الوسائط مفيداً في سير عمل تكون فيه الكمون والتكلفة ومعالجة البيانات عوامل مهمة.
لماذا يهم ذلك
تتبع الشركة مساراً تقوده الصناعة بدلاً من البدء بنموذج عام ثم البحث عن تطبيقات. وقالت TechNode إن الفريق يمتلك خبرة عميقة في الإعلام والعمل السمعي البصري، وترى Om AI أن هذه الخلفية توفر مشكلات إنتاج حقيقية وبيانات تشغيلية أعلى جودة.
ويهم هذا التركيز لأن ذكاء الفيديو قد يكون مكلفاً عندما يعتمد على نماذج كبيرة وموارد GPU سحابية. وتركز Om AI بدلاً من ذلك على نماذج أصغر وأسرع تعمل على الحافة. وإذا نجح هذا النهج، فقد تتمكن الشركات من تحليل الفيديو على الأجهزة المحلية، وخفض تكاليف الاستدلال، وتقليل الحاجة إلى رفع بيانات حساسة. وقد تكون هذه العوامل مهمة للمستخدمين المؤسسيين الذين يهتمون بالخصوصية والأمن وتوقع تكاليف التشغيل.
حالات استخدام الذكاء الاصطناعي على الحافة
ذكرت TechNode أن Om AI تركز على فهم الفيديو بنماذج منخفضة المعلمات. وتقول الشركة إن نماذجها يمكن أن تحقق سرعة استدلال على مستوى أجزاء من الألف من الثانية، وهو ما تقدمه كميزة لاستخدامات فورية تشمل الأمن والتفتيش الصناعي وتحليلات AIoT.
وتقول الشركة أيضاً إن أعمالها في الذكاء الاصطناعي تغطي أجهزة AI PC وAIoT والذكاء المجسد. وتستخدم نماذجها في الروبوتات والكلاب الروبوتية والطائرات المسيرة، ولديها تعاونات مع Apple وLenovo وHP، وفقاً للمصدر. كما أقام الإصدار الرئيسي من OttoBox AI Studio شراكات مع شركات رائدة في تصنيع أجهزة الكمبيوتر، منها Apple وLenovo وHP، لنشره في مساحة حواسيب الذكاء الاصطناعي.
زاوية المنتج والإتاحة
لا تستهدف Om AI أسواق المؤسسات والأجهزة فقط. فقد وصف المصدر أيضاً تطبيق Homer App، وهو منتج مصمم للمستخدمين من ذوي الإعاقة البصرية. ويمكنه دعم البحث عن الأشياء والملاحة المساعدة عبر الهواتف الذكية أو نظارات الذكاء الاصطناعي.
وتوضح هذه الحالة سبب إمكانية امتلاك الذكاء الاصطناعي متعدد الوسائط قيمة تتجاوز إنتاج المحتوى. والسؤال الأساسي هو ما إذا كانت نماذج الحافة تستطيع فهم الفيديو والصوت والنص معاً بما يكفي لدعم قرارات فورية في السيناريوهات الاستهلاكية والصناعية والمساعدة.
ما الذي يجب مراقبته
الأولوية الاستراتيجية الرئيسية لدى Om AI هذا العام هي VLX، وهو نموذجها متعدد الوسائط من الجيل التالي على الحافة. وذكرت TechNode أن VLX يهدف إلى تحسين فهم الفيديو واتخاذ القرار مع الاستمرار في تقليل تكاليف التشغيل.
ينبغي مراقبة ما إذا كانت Om AI قادرة على تحويل استراتيجيتها في نماذج الحافة إلى عمليات نشر متكررة عبر أجهزة AI PC وAIoT والأجهزة المجسدة. والإشارة الأوسع في السوق هي أن شركات الذكاء الاصطناعي الصينية الناشئة قد تتنافس بشكل متزايد على التنفيذ والمعالجة المحلية وحالات الاستخدام الرأسية بدلاً من حجم النموذج وحده.





