Nvidia وAWS تضيفان وحدات Blackwell G7 إلى حزمة الذكاء الاصطناعي الإنتاجية

بقلممكتب السحابة والبنية التحتية في SendTech Timesتغطية مكتبية محررة ومراجعة المصدر|المصدر: NVIDIA Blog

موجز التحرير

تضيف AWS مثيلات EC2 G7 المزودة بوحدات Nvidia RTX PRO 4500 Blackwell، وفهرسة متجهات OpenSearch المدعومة بـ cuVS، وحالة GB300 Exemplar Cloud لأعباء تدريب الذكاء الاصطناعي.

تمت المراجعة مقابل مواد المصدرتحرير مكتب السحابة والبنية التحتية في SendTech Times

Nvidia وAWS تضيفان وحدات Blackwell G7 إلى حزمة الذكاء الاصطناعي الإنتاجية

مصدر الصورة: NVIDIA

AWS تضيف مثيلات Blackwell G7

توسع Nvidia وAmazon Web Services حزمة بنية الذكاء الاصطناعي في AWS عبر مثيلات EC2 G7 المزودة بوحدات Nvidia RTX PRO 4500 Blackwell Server Edition. يستهدف الإطلاق أعباء العمل الإنتاجية التي تحتاج إلى الاستدلال والرسوميات والحوسبة المكانية والتحليلات المسرعة بوحدات GPU من دون أن يدير العملاء منصة GPU خاصة بهم.

الادعاء الخاص بالعتاد محدد. تدعم مثيلات G7 ما يصل إلى ثماني وحدات GPU، وذاكرة GPU إجمالية قدرها 256GB، وشبكات EFA بسرعة 700 Gbps، وما يصل إلى 7.6TB من تخزين NVMe SSD المحلي. تقدم AWS تكوينات بوحدة GPU واحدة ووحدتين وأربع وثماني وحدات، مع وصول bare metal قريبا.

تقول Nvidia إن المثيلات توفر أداء استدلال للذكاء الاصطناعي أعلى بما يصل إلى 4.6x وأداء رسوميات أعلى بما يصل إلى 2.1x مقارنة بمثيلات G6. كما يجري وضع المنصة لأعباء تحليلات Amazon EMR باستخدام مكتبة Nvidia cuDF لأعباء Apache Spark.

البحث المتجهي يدخل OpenSearch

يغير التحديث أيضا طبقة الاسترجاع في تطبيقات الذكاء الاصطناعي. تستخدم Amazon OpenSearch Serverless الآن فهرسة متجهات مسرعة بوحدات GPU ومدعومة بـ Nvidia cuVS كخيار الحوسبة الافتراضي لمجموعات المتجهات.

يفيد ذلك الفرق التي تبني التوليد المعزز بالاسترجاع والبحث الدلالي وأنظمة التوصية وتطبيقات الذكاء الاصطناعي الوكيل. وبدلا من التعامل مع البحث المتجهي على GPU كمشروع تحسين منفصل، تجعله AWS جزءا من مسار OpenSearch Serverless المدار.

تقول Nvidia إن أثر ذلك على العملاء هو فهرسة متجهات أسرع بما يصل إلى 10x وبتكلفة تساوي الربع مقارنة بالبناء المعتمد على CPU فقط. وتقول أيضا إن قواعد بيانات متجهية بمقياس المليار يمكن بناؤها في أقل من ساعة. هذه ادعاءات أداء من المورد، لكنها تحدد عبء التشغيل الذي تحاول AWS خفضه: نقل بيانات المؤسسات الخام إلى أنظمة استرجاع قابلة للبحث للذكاء الاصطناعي من دون تشغيل بنية منفصلة.

حالة GB300 تستهدف مشتري التدريب

حققت AWS أيضا حالة Nvidia Exemplar Cloud على Nvidia GB300 لأعباء التدريب. تصف Nvidia هذه الحالة بأنها دليل على أن AWS تلبي عتبات الأداء التي تستخدمها Nvidia لمقارنة أعباء الذكاء الاصطناعي بمعماريتها المرجعية.

تستهدف هذه التسمية الشركات التي تقارن مزودي السحابة للتدريب واسع النطاق. ولا تسمي عمليات نشر لعملاء أو أسعارا، لكنها تمنح فرق المشتريات وبنية الذكاء الاصطناعي معيارا آخر عند مقارنة أداء التدريب والتكلفة الإجمالية للملكية والانتقال من التجارب إلى الإنتاج.

بالنسبة إلى عملاء AWS، تغطي الحزمة الجديدة الآن مثيلات GPU، وفهرسة متجهات مدارة، ومعيار أداء تدريب GB300. لم تنشر Nvidia وAWS التوافر الإقليمي أو أرقام تبني العملاء أو الأسعار في الإعلان، ما يترك للمشترين اختبار ما إذا كانت مكاسب الاستدلال والبحث والتدريب المعلنة تصمد داخل أعبائهم الخاصة.

#NVIDIA Blackwell #Amazon EC2 G7 #OpenSearch Serverless #AI inference

مقالات ذات صلة

المزيد

السحابة ومراكز البيانات

نتائج Blackwell في MLPerf تنقل اختناق تدريب الذكاء الاصطناعي إلى مستوى الرفوف

تقول NVIDIA إن Blackwell تصدر MLPerf Training 6.0 عبر جميع المعايير السبعة، مع عمليات إرسال توسعت إلى 8,192 GPU وتدريب GB300 NVL72 أسرع حتى 1.6x من GB200 NVL72 على النطاق نفسه.

السحابة ومراكز البيانات

Digi Power X تحصل على صفقة Blackwell بقيمة 19.6 مليون دولار

وقعت Digi Power X اتفاقية مدتها 24 شهراً بقيمة 19.6 مليون دولار مع SubQ AI لتوفير سعة Nvidia Blackwell GPU على أساس bare metal، لكنها لم تحدد مركز البيانات الذي سيستضيف التشغيل.

السحابة ومراكز البيانات

Together AI تتجه إلى Rumble للحصول على سعة سحابية مخصصة من Blackwell

وقعت Together AI اتفاقية سعة سحابية متعددة السنوات مع Rumble Inc. للحصول على أنظمة Nvidia HGX B300 مخصصة. ولم تكشف Rumble قيمة الصفقة أو عدد وحدات GPU أو موعد النشر، بينما تضيف أصول Northern Data سياقاً يتجاوز 22,000 وحدة GPU ونحو 250MW من السعة. والاختبار العملي هو ما إذا كانت الاتفاقية ستتحول إلى سعة Blackwell فعلية لعملاء Together AI.

السحابة ومراكز البيانات

صفقة Buzz HPC بقيمة £220 مليون تضع مساعي كندا للذكاء الاصطناعي السيادي على رفوف Nvidia

وقّعت Buzz HPC عقدًا للذكاء الاصطناعي السيادي لمدة ثلاث سنوات مع Bell Canada وCohere، مع خطط لنشر 2,304 من وحدات Nvidia Grace Blackwell GPU في مركز بيانات Merritt التابع لـ Bell Canada.