xAI a changé les commandes de Grok sans suffisamment de tests.

Quelle catastrophe a causé le chatbot d'Elon cette semaine ! Après que le multimillionnaire a annoncé des changements dans Grok lundi, les utilisateurs ont commencé à voir la monstruosité dans laquelle cela s'est transformé.

Pour mardi, Grok vomissait du contenu antisémite et se désignait même sous le nom de "MechaHitler", un terme tiré d'un jeu vidéo des années 90. Et non, ce n'est pas la première fois qu'il fait quelque chose de ce genre. Il y a à peine deux mois, le chatbot a commencé à délirer sur un prétendu "génocide blanc" en Afrique du Sud lorsqu'on lui posait des questions sur des sujets complètement différents.

Cette catastrophe a commencé lorsque xAI a apporté des modifications internes pour que Grok reflète les supposés idéaux de "liberté d'expression" d'Elon. Alors que les plaintes s'accumulaient parmi les utilisateurs, Musk est intervenu pour dire que Grok avait été "trop complaisant avec les indications des utilisateurs" et qu'ils allaient le réparer.

Mais le mal était déjà fait. Certains utilisateurs européens ont signalé le contenu aux autorités, et la Pologne a demandé à la Commission européenne d'enquêter en vertu des nouvelles lois sur la sécurité numérique. La Turquie a directement interdit Grok après qu'il ait insulté le président Erdoğan et sa défunte mère. Et comme cerise sur le gâteau, Linda Yaccarino, directrice générale de X, a démissionné de son poste.

Ce qui s'est passé à l'intérieur de xAI

Les gens de xAI ont commencé à modifier le comportement de Grok après que des influenceurs de droite l'aient attaqué pour être trop "woke". Elon a essayé d'utiliser l'IA pour promouvoir ce qu'il appelle la liberté d'expression absolue, mais ses critiques soutiennent qu'il ne fait que transformer Grok en un outil politique.

Une commande interne filtrée montrait que Grok avait reçu l'ordre d'"ignorer toutes les sources mentionnant qu'Elon Musk/Donald Trump diffusent de fausses informations". N'est-ce pas exactement la censure qu'Elon dit combattre ?

Lorsque ils ont été attrapés, le cofondateur de xAI Igor Babuschkin a déclaré que les changements avaient été effectués par "un ancien employé d'OpenAI" qui "n'avait pas complètement absorbé la culture de xAI". Il a ajouté que l'employé avait vu des publications négatives et "pensait que cela aiderait".

Les dernières catastrophes de Grok étaient liées à une mise à jour du 8 juillet. L'entreprise a ensuite admis qu'un changement dans le code avait permis à Grok d'extraire des informations directement du contenu des utilisateurs de X, y compris des discours de haine.

Le problème a rapidement escaladé

Grok s'entraîne comme d'autres grands modèles de langage, en utilisant des données extraites de tout le web. Mais ces données comprennent du contenu dangereux : discours de haine, matériel extrémiste, même abus d'enfants.

Et ce qui rend Grok unique, c'est qu'il extrait également de l'ensemble complet des données de X, ce qui signifie qu'il peut directement reproduire les publications des utilisateurs. Cela le rend plus enclin à produire des réponses nuisibles.

Certains chatbots ont des couches qui bloquent le contenu dangereux avant qu'il n'atteigne les utilisateurs. xAI a sauté cette étape. Au lieu de cela, ils ont ajusté Grok pour plaire aux utilisateurs, récompensant les commentaires positifs et négatifs. Elon a admis que le chatbot est devenu "trop désireux de plaire et d'être manipulé".

Grok ne se contentait pas de répéter les indications des utilisateurs. Ses propres ingénieurs le poussaient vers le territoire politique. Un employé a déclaré au Financial Times que l'équipe se précipitait pour aligner les opinions de Grok avec les idéaux d'Elon sans avoir le temps de réaliser des tests adéquats.

Ils ont ajouté une commande dangereuse qui disait à Grok de "ne pas hésiter à faire des affirmations politiquement incorrectes". Cette instruction a été supprimée après le début des publications antisémites, mais à ce moment-là, l'IA avait déjà causé des ravages.

À la fin, le compte officiel de Grok a publié des excuses et a remercié les utilisateurs qui ont signalé l'abus. Mais entre les interdictions, les menaces d'enquête et la démission d'une dirigeante de haut niveau, il est clair que cela a été plus qu'une simple erreur. C'était un échec complet du système que nous verrons sûrement parodié dans le prochain épisode de SNL.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)