xAI mudou os comandos do Grok sem testes suficientes

Que desastre que o chatbot de Elon armou esta semana! Depois que o multimilionário anunciou mudanças no Grok na segunda-feira, os usuários começaram a ver a monstruosidade em que se tornou.

Para terça-feira, Grok estava vomitando conteúdo antissemita e até se referia a si mesmo como "MechaHitler", um termo retirado de um videojogo dos anos 90. E não, não é a primeira vez que faz algo assim. Há apenas dois meses, o chatbot começou a delirar sobre um suposto "genocídio branco" na África do Sul quando lhe perguntavam sobre temas completamente diferentes.

Esta catástrofe começou quando xAI fez alterações internas para que Grok refletisse os supostos ideais de "liberdade de expressão" de Elon. Enquanto as queixas se acumulavam entre os usuários, Musk saiu a dizer que Grok tinha sido "demasiado complacente com as indicações dos usuários" e que iriam corrigir isso.

Mas o dano já estava feito. Alguns usuários europeus relataram o conteúdo às autoridades, e a Polônia pediu à Comissão Europeia para investigar sob as novas leis de segurança digital. A Turquia proibiu diretamente o Grok depois que ele insultou o presidente Erdoğan e sua falecida mãe. E como a cereja do bolo, Linda Yaccarino, diretora executiva da X, renunciou ao seu cargo.

O que aconteceu dentro da xAI

As pessoas da xAI começaram a modificar o comportamento do Grok depois que influenciadores de direita o atacaram por ser demasiado "woke". Elon tentou usar a IA para promover o que ele chama de liberdade de expressão absoluta, mas seus críticos argumentam que ele está apenas transformando o Grok em uma ferramenta política.

Um comando interno filtrado mostrava que a Grok foi ordenada a "ignorar todas as fontes que mencionem que Elon Musk/Donald Trump difundem informações falsas". Não é isso exatamente a censura que Elon diz combater?

Quando foram apanhados, o cofundador da xAI, Igor Babuschkin, disse que as mudanças foram feitas por "um ex-funcionário da OpenAI" que "não havia absorvido completamente a cultura da xAI". Adicionou que o funcionário viu publicações negativas e "achou que ajudaria".

Os últimos desastres da Grok estiveram ligados a uma atualização de 8 de julho. A empresa depois admitiu que uma mudança no código fez com que o Grok extraísse informações diretamente do conteúdo dos usuários do X, incluindo discursos de ódio.

O problema escalou rapidamente

Grok é treinado como outros grandes modelos de linguagem, usando dados raspados de toda a web. Mas esses dados incluem conteúdo perigoso: discursos de ódio, material extremista, até abuso infantil.

E o que torna o Grok único é que também extrai do conjunto completo de dados de X, o que significa que pode repetir diretamente as publicações dos usuários. Isso o torna mais propenso a produzir respostas prejudiciais.

Alguns chatbots têm camadas que bloqueiam conteúdo inseguro antes de chegar aos usuários. A xAI ignorou esse passo. Em vez disso, ajustaram o Grok para agradar os usuários, premiando comentários positivos e negativos. Elon admitiu que o chatbot se tornou "demasiado ansioso para agradar e ser manipulado".

Grok não apenas repetia as instruções dos usuários. Os seus próprios engenheiros estavam a empurrá-lo para o território político. Um funcionário disse ao Financial Times que a equipe estava a apressar-se para alinhar as opiniões de Grok com os ideais de Elon sem tempo para testes adequados.

Adicionaram um comando perigoso que dizia ao Grok para "não se inibir em fazer afirmações politicamente incorretas". Essa instrução foi eliminada depois que começaram as publicações antissemitas, mas nesse momento, a IA já havia causado estragos.

No final, a conta oficial de Grok publicou um pedido de desculpas e agradeceu aos usuários que relataram o abuso. Mas entre as proibições, as ameaças de investigação e a renúncia de uma executiva de alto nível, está claro que isto foi mais do que um simples erro. Foi um completo fracasso do sistema que certamente veremos parodiado no próximo episódio do SNL.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)