Nvidia وAWS تضيفان وحدات Blackwell G7 إلى حزمة الذكاء الاصطناعي الإنتاجية
تضيف AWS مثيلات EC2 G7 المزودة بوحدات Nvidia RTX PRO 4500 Blackwell، وفهرسة متجهات OpenSearch المدعومة بـ cuVS، وحالة GB300 Exemplar Cloud لأعباء تدريب الذكاء الاصطناعي.

AWS تضيف مثيلات Blackwell G7
توسع Nvidia وAmazon Web Services حزمة بنية الذكاء الاصطناعي في AWS عبر مثيلات EC2 G7 المزودة بوحدات Nvidia RTX PRO 4500 Blackwell Server Edition. يستهدف الإطلاق أعباء العمل الإنتاجية التي تحتاج إلى الاستدلال والرسوميات والحوسبة المكانية والتحليلات المسرعة بوحدات GPU من دون أن يدير العملاء منصة GPU خاصة بهم.
الادعاء الخاص بالعتاد محدد. تدعم مثيلات G7 ما يصل إلى ثماني وحدات GPU، وذاكرة GPU إجمالية قدرها 256GB، وشبكات EFA بسرعة 700 Gbps، وما يصل إلى 7.6TB من تخزين NVMe SSD المحلي. تقدم AWS تكوينات بوحدة GPU واحدة ووحدتين وأربع وثماني وحدات، مع وصول bare metal قريبا.
تقول Nvidia إن المثيلات توفر أداء استدلال للذكاء الاصطناعي أعلى بما يصل إلى 4.6x وأداء رسوميات أعلى بما يصل إلى 2.1x مقارنة بمثيلات G6. كما يجري وضع المنصة لأعباء تحليلات Amazon EMR باستخدام مكتبة Nvidia cuDF لأعباء Apache Spark.
البحث المتجهي يدخل OpenSearch
يغير التحديث أيضا طبقة الاسترجاع في تطبيقات الذكاء الاصطناعي. تستخدم Amazon OpenSearch Serverless الآن فهرسة متجهات مسرعة بوحدات GPU ومدعومة بـ Nvidia cuVS كخيار الحوسبة الافتراضي لمجموعات المتجهات.
يفيد ذلك الفرق التي تبني التوليد المعزز بالاسترجاع والبحث الدلالي وأنظمة التوصية وتطبيقات الذكاء الاصطناعي الوكيل. وبدلا من التعامل مع البحث المتجهي على GPU كمشروع تحسين منفصل، تجعله AWS جزءا من مسار OpenSearch Serverless المدار.
تقول Nvidia إن أثر ذلك على العملاء هو فهرسة متجهات أسرع بما يصل إلى 10x وبتكلفة تساوي الربع مقارنة بالبناء المعتمد على CPU فقط. وتقول أيضا إن قواعد بيانات متجهية بمقياس المليار يمكن بناؤها في أقل من ساعة. هذه ادعاءات أداء من المورد، لكنها تحدد عبء التشغيل الذي تحاول AWS خفضه: نقل بيانات المؤسسات الخام إلى أنظمة استرجاع قابلة للبحث للذكاء الاصطناعي من دون تشغيل بنية منفصلة.
حالة GB300 تستهدف مشتري التدريب
حققت AWS أيضا حالة Nvidia Exemplar Cloud على Nvidia GB300 لأعباء التدريب. تصف Nvidia هذه الحالة بأنها دليل على أن AWS تلبي عتبات الأداء التي تستخدمها Nvidia لمقارنة أعباء الذكاء الاصطناعي بمعماريتها المرجعية.
تستهدف هذه التسمية الشركات التي تقارن مزودي السحابة للتدريب واسع النطاق. ولا تسمي عمليات نشر لعملاء أو أسعارا، لكنها تمنح فرق المشتريات وبنية الذكاء الاصطناعي معيارا آخر عند مقارنة أداء التدريب والتكلفة الإجمالية للملكية والانتقال من التجارب إلى الإنتاج.
بالنسبة إلى عملاء AWS، تغطي الحزمة الجديدة الآن مثيلات GPU، وفهرسة متجهات مدارة، ومعيار أداء تدريب GB300. لم تنشر Nvidia وAWS التوافر الإقليمي أو أرقام تبني العملاء أو الأسعار في الإعلان، ما يترك للمشترين اختبار ما إذا كانت مكاسب الاستدلال والبحث والتدريب المعلنة تصمد داخل أعبائهم الخاصة.
















