O benchmark que o nosso agente testou na prática, o foco principal é realizar tarefas diárias e não tarefas de codificação que exigem inteligência.


O Gemini 3 flash realmente não é a mesma base que o Gemini 3 pro; o Gemini 3 pro nem consegue chegar à mesa.
O TPS do minimax é impressionante; provavelmente poucas pessoas conseguem tolerar uma tartaruga para fazer tarefas diárias, por isso também não chega à mesa.
Ver original
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar