CoinVoice ha informado recientemente que el modelo DeepSeek-V3.2-Exp se lanzó oficialmente hoy y es de Código abierto. El modelo introduce una arquitectura de Attention disperso, que puede reducir efectivamente el consumo de recursos de cálculo y mejorar la eficiencia de inferencia del modelo. Actualmente, el modelo ya está listado en la plataforma MaaS de Huawei Cloud para modelos grandes como servicio. Para el modelo DeepSeek-V3.2-Exp, Huawei Cloud todavía utiliza el esquema de paralelismo EP grande para el despliegue, basado en la estructura de Attention disperso que implementa una estrategia de paralelismo de contexto de afinidad de secuencias largas, y también considera el tiempo de latencia y el rendimiento de procesamiento del modelo.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
CoinVoice ha informado recientemente que el modelo DeepSeek-V3.2-Exp se lanzó oficialmente hoy y es de Código abierto. El modelo introduce una arquitectura de Attention disperso, que puede reducir efectivamente el consumo de recursos de cálculo y mejorar la eficiencia de inferencia del modelo. Actualmente, el modelo ya está listado en la plataforma MaaS de Huawei Cloud para modelos grandes como servicio. Para el modelo DeepSeek-V3.2-Exp, Huawei Cloud todavía utiliza el esquema de paralelismo EP grande para el despliegue, basado en la estructura de Attention disperso que implementa una estrategia de paralelismo de contexto de afinidad de secuencias largas, y también considera el tiempo de latencia y el rendimiento de procesamiento del modelo.