Interview | Les grandes entreprises technologiques forment l'IA sur des données inutiles : Intuition

Les modèles d'IA deviennent de plus en plus puissants, mais les données sur lesquelles ils sont formés se détériorent, déclare le fondateur d'Intuition, Billy Luedtke. Résumé

  • L'IA n'est aussi bonne que les données que nous lui fournissons, déclare Billy Luedtke, fondateur d'Intuition
  • Nous sommes dans une ère de “slop-in, slop-out”, alors que l'IA devient récursive
  • Les modèles décentralisés ont l'avantage en termes de technologie et d'expérience utilisateur

À mesure que les systèmes d'IA deviennent de plus en plus omniprésents, les utilisateurs rencontrent de plus en plus de limitations difficiles à corriger. Alors que les modèles s'améliorent, les données sous-jacentes sur lesquelles ces modèles sont formés restent les mêmes. De plus, la récursivité, ou les modèles d'IA formés sur des données générées par d'autres IA, pourrait en fait aggraver la situation.

Pour parler de l'avenir de l'IA, crypto.news a parlé à Billy Luedtke, fondateur d'Intuition, un protocole décentralisé axé sur l'apport d'attribution vérifiable, de réputation et de propriété des données à l'IA. Luedtke explique pourquoi les ensembles de données actuels pour l'IA sont fondamentalement défaillants et ce qui peut être fait pour y remédier.

Crypto.news : Tout le monde se concentre actuellement sur l'infrastructure IA — GPU, énergie, centres de données. Les gens sous-estiment-ils l'importance de la couche de confiance dans l'IA ? Pourquoi est-ce important ?

Billy Luedtke : 100 %. Les gens sous-estiment définitivement cela — et cela compte pour plusieurs raisons.

Tout d'abord, nous entrons dans ce que j'appelle une ère de “slop-in, slop-out”. L'IA n'est aussi bonne que les données qu'elle consomme. Mais ces données — en particulier celles provenant du web ouvert — sont largement polluées. Elles ne sont pas propres. Elles ne reflètent pas l'intention humaine. Une grande partie provient de comportements gamifiés en ligne : likes, avis, hacks d'engagement — tous filtrés par des algorithmes optimisés pour l'attention.

Donc, lorsque l'IA parcourt Internet, ce qu'elle voit n'est pas une image holistique de qui nous sommes. Elle voit des gens utiliser la plateforme. Je ne me comporte pas de la même manière sur Twitter que dans la vie réelle. Aucun de nous ne le fait. Nous optimisons pour l'algorithme — pas pour exprimer une pensée authentique.

C'est aussi récursif. Les plateformes nous entraînent, et nous renvoyons un comportement encore plus déformé. Cela crée une boucle de rétroaction — un spirale — qui déforme encore plus la perception de l'IA sur l'humanité. Nous ne lui enseignons pas ce que nous pensons ; nous lui enseignons ce que nous pensons qui obtiendra des likes.

L'utilisateur moyen ne cherche pas sur Google, ne compare pas les sources et ne réfléchit pas de manière critique. Il demande simplement à ChatGPT ou à un autre modèle et prend la réponse pour argent comptant.

C'est dangereux. Si le modèle est opaque — une boîte noire — et que l'entreprise qui le contrôle contrôle également les informations qui vous sont montrées ou non, alors cela représente un contrôle total du récit. C'est centralisé, irresponsable et extrêmement puissant.

Imaginez demander à Grok quel est le meilleur podcast, et la réponse est celui qui a payé Elon le plus. Ce n'est pas de l'intelligence — c'est juste de la publicité déguisée.

CN : Alors, comment pouvons-nous résoudre cela ? Comment construire des systèmes qui privilégient la vérité et la valeur au lieu de l'engagement ?

BL : Nous devons inverser les incitations. Ces systèmes devraient servir les gens — pas les institutions, pas les actionnaires, pas les annonceurs. Cela signifie construire une nouvelle couche pour Internet : des primitives d'identité et de réputation. C'est ce que nous faisons chez Intuition.

Nous avons besoin d'une attribution vérifiable : qui a dit quoi, quand et dans quel contexte. Et nous avons besoin d'une réputation portable et décentralisée qui aide à déterminer combien nous pouvons faire confiance à une source de données donnée — non pas sur la base d'une impression, mais sur un véritable historique contextuel.

Reddit est un parfait exemple. C'est l'une des plus grandes sources de données d'entraînement pour les modèles. Mais si un utilisateur dit sarcastiquement : “Juste k*** yourself,” cela peut être extrait et apparaître dans la recommandation d'un modèle à quelqu'un demandant des conseils médicaux.

C'est horrible — et c'est ce qui se passe lorsque les modèles n'ont pas de contexte, d'attribution ou de pondération de la réputation. Nous devons savoir : cette personne est-elle crédible en médecine ? Est-elle réputée en finance ? Est-ce une source de confiance, ou juste un autre commentaire aléatoire ?

CN : Lorsque vous parlez d'attribution et de réputation, ces données doivent être stockées quelque part. Comment pensez-vous à cela en termes d'infrastructure — surtout avec des problèmes comme le droit d'auteur et la compensation ?

BL : C'est exactement ce que nous résolvons chez Intuition. Une fois que vous avez des primitives d'attribution vérifiables, vous savez qui a créé quelles données. Cela permet une propriété tokenisée du savoir — et avec cela, une compensation.

Ainsi, au lieu que vos données résident sur les serveurs de Google ou les API d'OpenAI, elles résident sur un graphe de connaissances décentralisé. Chacun possède ce qu'il contribue. Lorsque vos données sont parcourues ou utilisées dans une sortie d'IA, vous recevez une part de la valeur qu'elles génèrent.

Cela importe parce qu'en ce moment nous sommes des serfs numériques. Nous dépensons nos ressources les plus précieuses — temps, attention et créativité — à générer des données que quelqu'un d'autre monétise. YouTube n'est pas précieux parce qu'il héberge des vidéos ; il est précieux parce que les gens le curation. Sans likes, commentaires ou abonnements, YouTube est sans valeur.

Nous voulons donc un monde où chacun peut tirer profit de la valeur qu'il génère — même si vous n'êtes pas un influenceur ou un extraverti. Si vous êtes régulièrement parmi les premiers à découvrir de nouveaux artistes, par exemple, votre goût a de la valeur. Vous devriez pouvoir construire une réputation autour de cela et la monétiser.

CN : Mais même si nous obtenons de la transparence, ces modèles restent vraiment difficiles à interpréter. OpenAI lui-même ne peut pas expliquer pleinement comment ses modèles prennent des décisions. Que se passe-t-il alors ?

BL : Bon point. Nous ne pouvons pas interpréter complètement le comportement des modèles — ils sont tout simplement trop complexes. Mais ce que nous pouvons contrôler, c'est les données d'entraînement. C'est notre levier.

Je vais te donner un exemple : j'ai entendu parler d'un article de recherche où une IA était obsédée par les hiboux et une autre était douée en mathématiques. Ils n'ont été formés ensemble que sur des tâches liées aux mathématiques. Mais à la fin, l'IA en mathématiques a aussi commencé à aimer les hiboux — juste en absorbant le modèle de l'autre.

C'est fou à quel point ces motifs sont subliminaux et subtils. Donc, la seule véritable défense est l'intention. Nous devons être délibérés sur les données que nous fournissons à ces modèles. Nous devons “nous guérir”, d'une certaine manière, pour nous montrer en ligne de manière plus authentique et constructive. Parce que l'IA reflétera toujours les valeurs et les distorsions de ses créateurs.

CN : Parlons affaires. OpenAI brûle des liquidités. Leur infrastructure est extrêmement coûteuse. Comment un système décentralisé comme Intuition peut-il concurrencer — financièrement et techniquement ?

BL : Nous avons deux avantages fondamentaux : la composabilité et la coordination.

Les écosystèmes décentralisés — en particulier dans la crypto — sont incroyablement efficaces en matière de coordination. Nous avons des équipes mondiales et distribuées travaillant sur différents composants du même problème plus large. Au lieu qu'une seule entreprise dépense des milliards à lutter contre le monde, nous avons des centaines de contributeurs alignés construisant des outils interopérables.

C'est comme un mosaic. Une équipe travaille sur la réputation des agents, une autre sur le stockage décentralisé, une autre sur les primitives d'identité — et nous pouvons les assembler.

C'est le superpouvoir.

Le deuxième avantage est l'expérience utilisateur. OpenAI est enfermé dans son fossé. Ils ne peuvent pas vous permettre de transférer votre contexte de ChatGPT à Grok ou Anthropic — cela éroderait leur défense. Mais nous ne nous soucions pas de la dépendance au fournisseur.

Dans notre système, vous pourrez posséder votre contexte, l'emporter avec vous et l'intégrer à l'agent de votre choix. Cela améliore l'expérience. Les gens le choisiront.

****CN:Quels sont les coûts d'infrastructure ? Faire fonctionner de grands modèles est extrêmement coûteux. Voyez-vous un monde où de plus petits modèles fonctionnent localement ?

BL : Oui, 100 %. Je pense en fait que c'est la direction dans laquelle nous nous dirigeons — vers de nombreux petits modèles fonctionnant localement, connectés comme des neurones dans un essaim distribué.

Au lieu d'un grand centre de données monolithique, vous avez des milliards de dispositifs consommateurs contribuant au calcul. Si nous pouvons les coordonner — ce que l'crypto excelle à faire — cela devient une architecture supérieure.

Et c'est pourquoi nous construisons également des couches de réputation des agents. Les demandes peuvent être dirigées vers le bon agent spécialisé pour le travail. Vous n'avez pas besoin d'un modèle massif pour tout faire. Vous avez juste besoin d'un système intelligent pour le routage des tâches — comme une couche API à travers des millions d'agents.

CN : Qu'en est-il du déterminisme ? Les LLM ne sont pas très efficaces pour des tâches comme les mathématiques, où vous voulez des réponses exactes. Pouvons-nous combiner du code déterministe avec de l'IA ?

BL : C'est ce que je veux. Nous devons ramener le déterminisme dans la boucle.

Nous avons commencé par le raisonnement symbolique — entièrement déterministe — puis nous avons plongé à fond dans l'apprentissage profond, qui est nondéterministe. Cela nous a donné l'explosion que nous voyons maintenant. Mais l'avenir est neurosymbolique — combinant le meilleur des deux.

Laissez l'IA gérer le raisonnement flou. Mais laissez-la aussi déclencher des modules déterministes — scripts, fonctions, moteurs logiques — là où vous avez besoin de précision. Pensez : “Lequel de mes amis aime ce restaurant ?” Cela devrait être 100 % déterministe.

****CN:Prendre du recul : nous avons vu des entreprises intégrer l'IA dans leurs opérations. Mais les résultats ont été mitigés. Pensez-vous que la génération actuelle de LLM augmente vraiment la productivité ?

BL : Absolument. La singularité est déjà là — elle est juste inégalement répartie.

Si vous n'utilisez pas l'IA dans votre flux de travail, en particulier pour le code ou le contenu, vous travaillez à une fraction de la vitesse des autres. La technologie est réelle, et les gains d'efficacité sont énormes. La disruption a déjà eu lieu. Les gens ne l'ont tout simplement pas encore pleinement réalisé.

CN : Dernière question. Beaucoup de gens disent que c'est une bulle. Le capital-risque s'assèche. OpenAI brûle de l'argent. Nvidia finance ses propres clients. Comment cela se termine-t-il ?

BL : Oui, il y a une bulle — mais la technologie est réelle. Chaque bulle éclate, mais ce qui reste ensuite, ce sont les technologies de base. L'IA va en faire partie. L'argent idiot — toutes ces applications de façade sans réelle innovation — est en train d'être évacué. Mais les équipes d'infrastructure profonde ? Elles vont survivre.

En fait, cela pourrait aller dans un sens ou dans l'autre : nous avons une légère correction et revenons à la réalité, mais les progrès continuent. Ou bien, les gains de productivité sont si immenses que l'IA devient une force déflationniste sur l'économie. Le PIB pourrait être multiplié par 10 ou 100 en capacité de production. Si cela se produit, les dépenses en valaient la peine — nous progressons en tant que société.

Quoi qu'il en soit, je suis optimiste. Il y aura du chaos et des pertes d'emplois, oui — mais aussi le potentiel pour un monde abondant et post-rare si nous construisons la bonne fondation.

ON-8.16%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)