Orgullo nacional DeepSeek-V4 acaba de ser de código abierto, ¡lanzando directamente un contexto ultra largo de más de 1 millón de palabras!


DeepSeek-V4 introduce un mecanismo de atención completamente nuevo y realiza compresión en la dimensión de tokens, combinándose con la atención dispersa DSA (DeepSeek Sparse Attention), lo que reduce el consumo de potencia de cálculo y memoria al procesar contextos extremadamente largos.
Los datos de prueba muestran que, en la evaluación de Programación Agente (Agentic Coding), el rendimiento de V4-Pro ya supera al Sonnet 4.5, que es común en la industria, y se acerca al nivel de Opus 4.6 en modo no reflexivo.
Para satisfacer diferentes demandas del mercado, DeepSeek implementa una estrategia de doble línea: la versión Pro se enfoca en razonamiento de alta dificultad y conocimientos mundiales, mientras que la versión Flash, con menos parámetros, se encarga de ofrecer llamadas API a costos extremadamente bajos.
Ver originales
post-image
post-image
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado