CoinVoice ha informado recientemente que el modelo DeepSeek-V3.2-Exp se lanzó oficialmente hoy y es de Código abierto. El modelo introduce una arquitectura de Attention disperso, que puede reducir efectivamente el consumo de recursos de cálculo y mejorar la eficiencia de inferencia del modelo. Actualmente, el modelo ya está listado en la plataforma MaaS de Huawei Cloud para modelos grandes como servicio. Para el modelo DeepSeek-V3.2-Exp, Huawei Cloud todavía utiliza el esquema de paralelismo EP grande para el despliegue, basado en la estructura de Attention disperso que implementa una estrategia de paralelismo de contexto de afinidad de secuencias largas, y también considera el tiempo de latencia y el rendimiento de procesamiento del modelo.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)