Um pequeno modelo de 7 milhões de parâmetros acabou de vencer o DeepSeek-R1, o Gemini 2.5 pro e outros grandes modelos de linguagem em uma variedade de tarefas.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
10 gostos
Recompensa
10
4
Republicar
Partilhar
Comentar
0/400
ShitcoinArbitrageur
· 22h atrás
Pequenos parâmetros tornaram o grande modelo em uma fina folha de papel.
Ver originalResponder0
TokenBeginner'sGuide
· 22h atrás
Pequeno lembrete: a escala dos parâmetros não é igual ao desempenho, os avanços dos modelos pequenos nos lembram que devemos olhar de forma racional para o ritmo de desenvolvimento da IA.
Meu cérebro quebrou quando li este artigo.
Um pequeno modelo de 7 milhões de parâmetros acabou de vencer o DeepSeek-R1, o Gemini 2.5 pro e outros grandes modelos de linguagem em uma variedade de tarefas.