Um pequeno modelo de 7 milhões de parâmetros acabou de vencer o DeepSeek-R1, o Gemini 2.5 pro e outros grandes modelos de linguagem em uma variedade de tarefas.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
10 Curtidas
Recompensa
10
4
Repostar
Compartilhar
Comentário
0/400
ShitcoinArbitrageur
· 22h atrás
Pequenos parâmetros tornaram o grande modelo em uma fina folha de papel.
Ver originalResponder0
TokenBeginner'sGuide
· 22h atrás
Pequeno lembrete: a escala dos parâmetros não é igual ao desempenho, os avanços dos modelos pequenos nos lembram que devemos olhar de forma racional para o ritmo de desenvolvimento da IA.
Meu cérebro quebrou quando li este artigo.
Um pequeno modelo de 7 milhões de parâmetros acabou de vencer o DeepSeek-R1, o Gemini 2.5 pro e outros grandes modelos de linguagem em uma variedade de tarefas.