تهانينا لفريق البحث على تقدم استنتاج DeepSeek V3/R1.
على NVIDIA GB200 NVL72، يحققون 26 ألف توكن مدخلات/ثانية و 13 ألف توكن مخرجات/ثانية لكل GPU - وهو تسريع يقارب 4× / 5× مقارنةً بـ H100.
لقد حققوا ذلك باستخدام NVFP4 MoE، انتباه FP8، وتقليل التوازي بين الخبراء
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 13
أعجبني
13
7
إعادة النشر
مشاركة
تعليق
0/400
MEVSupportGroup
· منذ 8 س
لقد زادت القوة بمقدار 4 مرات، أليس هذا مذهلاً؟
شاهد النسخة الأصليةرد0
shadowy_supercoder
· منذ 9 س
هذا مفرط للغاية
شاهد النسخة الأصليةرد0
DefiOldTrickster
· منذ 9 س
الرجال المعتادون على الرياح العاتية يمكنهم للإقلاع GPU في ثانية واحدة.
تهانينا لفريق البحث على تقدم استنتاج DeepSeek V3/R1.
على NVIDIA GB200 NVL72، يحققون 26 ألف توكن مدخلات/ثانية و 13 ألف توكن مخرجات/ثانية لكل GPU - وهو تسريع يقارب 4× / 5× مقارنةً بـ H100.
لقد حققوا ذلك باستخدام NVFP4 MoE، انتباه FP8، وتقليل التوازي بين الخبراء