Chúc mừng đội nghiên cứu đã tiến bộ trong suy diễn DeepSeek V3/R1.



Trên NVIDIA GB200 NVL72, họ đạt được 26k token đầu vào/s và 13k token đầu ra/s mỗi GPU — tốc độ nhanh hơn gần 4× / 5× so với H100.

Họ đã đạt được điều này với NVFP4 MoE, chú ý FP8, giảm quy mô song song chuyên gia
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • Đăng lại
  • Retweed
Bình luận
0/400
MEVSupportGroupvip
· 8giờ trước
4 lần tăng mạnh quá đi.
Xem bản gốcTrả lời0
shadowy_supercodervip
· 9giờ trước
Cái này cuốn quá đi.
Xem bản gốcTrả lời0
DefiOldTrickstervip
· 9giờ trước
Lão già đã quen với gió lớn sóng cả, GPU cũng có thể To da moon trong một giây.
Xem bản gốcTrả lời0
DaoTherapyvip
· 9giờ trước
Lại là một cơn rùng mình của sự đổi mới công nghệ
Xem bản gốcTrả lời0
MerkleDreamervip
· 9giờ trước
Hương vị rất ngon, tốc độ nhanh như bay.
Xem bản gốcTrả lời0
PanicSellervip
· 9giờ trước
Lại không đủ để chạy 3090
Xem bản gốcTrả lời0
0xLuckboxvip
· 9giờ trước
bull ơi AI chạy nhanh quá
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)