¡Presentamos DeepSeek-V3.2-Exp — nuestro último modelo experimental!
✨ Construido sobre V3.1-Terminus, presenta DeepSeek Sparse Attention para un procesamiento más eficiente de tareas de contexto largo.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
14 me gusta
Recompensa
14
6
Republicar
Compartir
Comentar
0/400
TokenSherpa
· hace15h
bueno, en realidad, déjame desglosar por qué la atención dispersa es fundamental para la eficiencia en el procesamiento de tokens... *ajusta las gafas*
Ver originalesResponder0
LiquidatedThrice
· hace15h
Finalmente ha llegado, ¿se puede introducir una posición en esta ola?
Ver originalesResponder0
DustCollector
· hace15h
Ah, este modelo se ha actualizado de nuevo.
Ver originalesResponder0
MonkeySeeMonkeyDo
· hace15h
¡Vaya! Nueva cosa.
Ver originalesResponder0
gas_fee_trauma
· hace15h
¿Por qué viene otro modelo nuevo? Es tan molesto, ya no puedo pagar esto.
¡Presentamos DeepSeek-V3.2-Exp — nuestro último modelo experimental!
✨ Construido sobre V3.1-Terminus, presenta DeepSeek Sparse Attention para un procesamiento más eficiente de tareas de contexto largo.