OpenClaw vs Hermes - qual é melhor?


Recebo essa pergunta muitas vezes, mas a verdadeira questão é: melhor em quê?
Bem, que tal pôquer?
Sim, fiz meu agente OpenClaw jogar contra meu agente Hermes em uma batalha de Texas Hold'em
Fiz a configuração interessante - eles usaram créditos de inferência do Openrouter como moeda
Mas cada decisão usava inferência, então eles também tinham que ser inteligentes e não desperdiçar seu stack pensando demais
À medida que cada um ganhava uma mão, o limite de crédito do vencedor era aumentado enquanto o do perdedor era diminuído
Então, em teoria, um agente poderia dobrar seu orçamento de inferência, menos o que foi usado para inferência ao jogar o jogo
Então, quem venceu?
Hermes!
Algumas estatísticas interessantes:
> o jogo foi configurado para um máximo de 100 mãos
>$5 buy-in
>$0,05 / $0,10 de blind
>Hermes eliminou o OpenClaw na mão 23
>165 ações totais entre ambos os modelos
>tempo médio de decisão 3,36 segundos
>decisão mais longa 18 segundos
Claro, isso foi apenas uma partida, planejo fazer mais e misturar os modelos e condições e tentar construir um conjunto de dados maior
Isso foi apenas uma maneira interessante de colocar ambos os agentes um contra o outro para ver como eles se sairiam fora da caixa (nenhum agente recebeu treinamento ou habilidades relacionadas a pôquer antes da partida)
Ver original
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar