Apresentando o DeepSeek-V3.2-Exp — o nosso mais recente modelo experimental!
✨ Construído em V3.1-Terminus, estreia o DeepSeek Sparse Attention para um processamento mais eficiente de tarefas de longo contexto.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
13 gostos
Recompensa
13
6
Republicar
Partilhar
Comentar
0/400
TokenSherpa
· 10h atrás
bem, na verdade, deixe-me explicar porque a atenção esparsa é fundamental para a eficiência do processamento de tokens... *ajusta os óculos*
Ver originalResponder0
LiquidatedThrice
· 10h atrás
Finalmente chegou. Esta onda dá para entrar numa posição?
Ver originalResponder0
DustCollector
· 10h atrás
Ah, este modelo foi atualizado novamente.
Ver originalResponder0
MonkeySeeMonkeyDo
· 10h atrás
Uau, nova coisa!
Ver originalResponder0
gas_fee_trauma
· 10h atrás
Por que vem outro modelo? Que chato, não dá para aguentar.
Apresentando o DeepSeek-V3.2-Exp — o nosso mais recente modelo experimental!
✨ Construído em V3.1-Terminus, estreia o DeepSeek Sparse Attention para um processamento mais eficiente de tarefas de longo contexto.