اختبارات SEMQ تستهدف خفض عبء ذاكرة الذكاء الاصطناعي من دون عملاء معلنين
تطرح SEMQ Group تقنية Symbolic Embedding Multi-Quantization للحفاظ على سلوك الاسترجاع والتصنيف مع خفض عبء الحالة الدلالية في الذكاء الاصطناعي، لكن الدليل العلني لا يزال قائماً على الاختبارات مع عدم إعلان أسماء العملاء.

SEMQ تستهدف ذاكرة التضمينات بدلاً من أوزان النموذج
تقترح SEMQ Group طريقة مختلفة لخفض عبء التخزين والذاكرة حول أنظمة الذكاء الاصطناعي. ويفصل نهج الشركة، المسمى Symbolic Embedding Multi-Quantization، المعنى الملتقط في التضمينات عن التمثيل الرقمي المستخدم عادة لتخزين تلك التضمينات.
قال Andrés Mac Allister، الرئيس التنفيذي ومؤسس SEMQ Group، إن الطريقة تركز على العلاقة الهيكلية بين مكونات التضمين بدلاً من الحفاظ على كل مقدار رقمي عائم. والادعاء صادر عن الشركة، لكنه مرتبط بهدف تقني محدد هو الحالة الدلالية المستخدمة في الاسترجاع والذاكرة وتدفقات التصنيف.
Mac Allister يستشهد بنتائج اختبار Banking77
وصف Mac Allister أنظمة التضمين التقليدية بأنها تسلسلات من إحداثيات رقمية عالية الدقة. ويقارن الشرح العلني ذلك بملفات SEMQ التي تهدف إلى الحفاظ على ترتيب التشابه النسبي وبنية الجوار وخصائص علاقية أخرى مع فصل التمثيل عن المقاييس والفهرسة ودلالات التنفيذ.
تعرض المادة خط الأساس التخزيني للتكميم التقليدي. وقال Mac Allister إن FP32 يتطلب 4 بايتات لكل معامل، لذلك يحتاج نموذج 7B إلى نحو 28 GB من مساحة القرص والذاكرة. وقال إن FP16 أو BF16 يتطلب بايتين لكل معامل ويضع النموذج نفسه قرب 14 GB، بينما تخفض خيارات أصغر مثل FP8 وINT8 وQ8 وQ6 وQ5 وQ4 وQ3 وQ2 البصمة مع دقة أقل.
استشهد Mac Allister باختبار واحد يستخدم مجموعة Banking77 من MTEB ونموذج التضمين all-MiniLM-L6-v2. وقال إن خط أساس FP32 حقق دقة 92.26%، وحققت SEMQ دقة 92.27%، وسجل التكميم 4-bit دقة 56.05%. تأتي هذه الأرقام من أعمال تحقق أشارت إليها الشركة، وليس من أنظمة إنتاج لعملاء مسمين.
أدلة العملاء لا تزال خلف اتفاقيات السرية
يمكن تطبيق SEMQ عند إدخال البيانات أو وقت الاستعلام، بحسب Mac Allister. وقال إن الفرق يمكنها استخدام SDK على المتجهات التي يولدها نموذج التضمين الحالي، ويمكنها تشغيل SEMQ بجانب LLM أو نموذج تضمين أو قاعدة بيانات متجهية أو إطار عمل للوكلاء قبل استخدامه لأعمال استرجاع أو ذاكرة مختارة.
قال Mac Allister أيضاً إن ملفات .semq استُخدمت في البحث لالتقاط حالة transformer KV-cache واستعادتها عبر حدود العمليات. ولم يقدم ذلك كتدفق عمل للتدريب المسبق، بل كتدفق حالة وقت التشغيل لإيقاف جلسة نموذج نشطة ونقلها واستئنافها.
لم تسم SEMQ Group عملاء. وقال Mac Allister إن الشركة وقعت اتفاقيات سرية مع مؤسسات في Founding Design Partnership Program، ولا يكشف السجل العلني أسماء العملاء أو أحجام النشر أو وفورات البنية التحتية أو تحققاً معيارياً من طرف ثالث.
















