Deep Seek ha anunciado un nuevo modelo MODEL1: Un paso técnico en un año

robot
Generación de resúmenes en curso

DeepSik ha alcanzado nuevas alturas en sus avances técnicos con un anuncio histórico reciente. A principios de enero, un año después del éxito de DeepSik-R1, la compañía está lista para presentar su nuevo modelo MODEL1. Esta noticia ha sido recibida como un gran avance por expertos de la industria y en el mundo tecnológico.

Revelación de cambios técnicos en GitHub

DeepSik actualizó su código en GitHub indicando cambios importantes. En la actualización, se encontró mención de “MODEL1” en 28 de las 114 archivos en diferentes ubicaciones, lo que indica un esfuerzo amplio en el desarrollo del nuevo modelo. Estos cambios en el código Flash MLA son especialmente relevantes y apuntan hacia una nueva dirección técnica.

MODEL1 frente a V32: Nueva arquitectura

La versión actual V32, conocida como DeepSik V 3.2, será diferente en su nueva estructura con MODEL1. Las diferencias principales se destacan en tres áreas clave: mejoras en la estructura de KV Cache, cambios en el método de cuantización y nuevas técnicas en la codificación FP8D. Todos estos cambios están diseñados para hacer el sistema más eficiente.

Ahorro de memoria y nuevos logros en computación

Una gran ventaja de MODEL1 es la mejora en el uso de memoria durante el procesamiento. Se ha implementado una estrategia única para ahorrar memoria en diferentes etapas del procesamiento. Estos cambios convertirán al nuevo modelo de DeepSik en uno con mejor rendimiento y menor consumo de recursos, representando un avance importante en la industria.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado