Apresentando o DeepSeek-V3.2-Exp — o nosso mais recente modelo experimental!
✨ Construído em V3.1-Terminus, estreia o DeepSeek Sparse Attention para um processamento mais eficiente de tarefas de longo contexto.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
13 Curtidas
Recompensa
13
6
Repostar
Compartilhar
Comentário
0/400
TokenSherpa
· 5h atrás
bem, na verdade, deixe-me explicar porque a atenção esparsa é fundamental para a eficiência do processamento de tokens... *ajusta os óculos*
Ver originalResponder0
LiquidatedThrice
· 5h atrás
Finalmente chegou. Esta onda dá para entrar numa posição?
Ver originalResponder0
DustCollector
· 5h atrás
Ah, este modelo foi atualizado novamente.
Ver originalResponder0
MonkeySeeMonkeyDo
· 5h atrás
Uau, nova coisa!
Ver originalResponder0
gas_fee_trauma
· 6h atrás
Por que vem outro modelo? Que chato, não dá para aguentar.
Apresentando o DeepSeek-V3.2-Exp — o nosso mais recente modelo experimental!
✨ Construído em V3.1-Terminus, estreia o DeepSeek Sparse Attention para um processamento mais eficiente de tarefas de longo contexto.