Huang Renxiong et Ma Yun se battent tous les deux, voyez clair le modèle commercial derrière le Token

robot
Création du résumé en cours

Hier soir, le PDG de NVIDIA, Huang Renxun, a prononcé le discours principal de GTC 2026. La veille, Alibaba a créé le groupe d’affaires Token Hub, dirigé personnellement par le PDG Wu Yongming.

Deux géants, le même jour, se concentrent sur la même chose : le Token. Comment le Token peut-il réellement générer des revenus ? Aujourd’hui, nous allons tout vous expliquer.

Qu’est-ce que le Token ?

Huang Renxun a donné une métaphore : le Token est le pétrole du monde numérique.

Vous demandez une phrase à ChatGPT, générez une vidéo, faites bouger un robot, tout cela consomme des Tokens. C’est l’unité de base pour la compréhension et la génération d’informations par l’IA, ainsi que la mesure de tous les services intelligents futurs.

Comment sont facturés les Tokens ? Combien une entreprise doit-elle payer ?

Huang Renxun a révélé pour la première fois lors de son discours le système de tarification hiérarchisé des Tokens. Ce n’est pas une simple idée, mais une véritable grille tarifaire :

Niveau gratuit : débit élevé, vitesse faible, pour attirer les utilisateurs

Niveau de base : 3 dollars par million de Tokens, pour les utilisateurs ordinaires

Niveau avancé : 6 dollars par million de Tokens, modèles plus grands, vitesse plus rapide

Niveau haute vitesse : 45 dollars par million de Tokens, supporte de longs contextes, inférence profonde

Niveau premium : 150 dollars par million de Tokens, pour des tâches de recherche ultra-longues, réponse en temps réel pour les chemins critiques

Huang Renxun a fait un calcul : « Un chercheur utilisant 50 millions de Tokens par jour, à 150 dollars par million, cela reste tout à fait acceptable pour une équipe de recherche. »

Que cela signifie-t-il ? Le Token n’est pas un achat ponctuel, mais une consommation continue. Si vous le brûlez aujourd’hui, vous devrez le faire à nouveau demain. Tant que l’IA fonctionne, le Token continue de brûler.

Le modèle commercial de CUDA : pourquoi Huang Renxun peut dire “la puissance de calcul devient de plus en plus bon marché”

Comment NVIDIA gagne-t-il de l’argent avec le Token ? La clé est CUDA. Vous pouvez le voir comme le « système d’exploitation » du monde de l’IA. Toutes les applications IA doivent fonctionner sur CUDA, comme toutes les applications mobiles tournent sur Android ou iOS.

La barrière de CUDA est une base d’installation de centaines de millions d’unités.

NVIDIA a passé 20 ans à faire fonctionner des centaines de millions de GPU avec CUDA, intégrant chaque cloud, chaque entreprise informatique, presque chaque secteur. Cette base d’installation crée un effet de volant : une grande base d’installation attire des développeurs du monde entier ; ces développeurs créent de nouveaux algorithmes, générant de nouveaux marchés ; ces nouveaux marchés nécessitent plus de puissance de calcul, ce qui accroît encore la base d’installation.

Le résultat de ce volant est une baisse continue du coût de la puissance de calcul.

Huang Renxun a donné un exemple contre-intuitif : il y a six ans, les GPU Ampere étaient vendus, mais aujourd’hui, leur prix en cloud a même augmenté. Pourquoi ? Parce que de plus en plus d’applications tournent sur ces vieux chips, et chaque optimisation logicielle par NVIDIA permet à tous les utilisateurs existants d’accélérer gratuitement.

Que cela signifie-t-il ? La puissance de calcul que vous achetez aujourd’hui ne deviendra pas obsolète dans quelques années, mais pourrait même prendre de la valeur. Dans le secteur du matériel, c’est presque une utopie.

Huang Renxun a déclaré : « Une fois que vous avez installé un GPU NVIDIA, vous bénéficiez d’une évolution de performance à long terme. Ce n’est pas seulement une accélération initiale, mais une réduction continue des coûts. »

C’est le modèle commercial de CUDA : bâtir une base d’installation avec le matériel, créer de la valeur en continu avec le logiciel, et verrouiller les utilisateurs dans l’écosystème. Des centaines de millions de GPU dans le monde exécutent CUDA, et chaque Token consommé doit passer par la plateforme NVIDIA.

Cela change toute la logique commerciale. Avant, les entreprises achetaient des cartes IA comme une dépense en capital unique. Une fois achetées, c’était fini, sans lien avec le fournisseur. Maintenant, la carte IA devient une ligne de production de Tokens, et les entreprises dépensent de l’argent pour « acheter du carburant » plutôt que du matériel. Aujourd’hui, vous brûlez tout, demain vous en achetez encore. Ce qui était une dépense ponctuelle devient une opération continue.

C’est ce qu’on appelle la location. Vous payez aujourd’hui, vous payerez encore demain.

Pourquoi Alibaba s’engage-t-il si rapidement ? Un combat inévitable

Regardons maintenant les actions d’Alibaba. Le 16 mars, Alibaba a créé le groupe d’affaires Alibaba Token Hub, dirigé personnellement par Wu Yongming, avec pour objectif : Créer des Tokens, les transporter, et les appliquer.

Pourquoi Alibaba est-il si pressé ?

Le problème central est : les capacités d’IA sont trop dispersées. Au cours des deux dernières années, l’IA d’Alibaba était répartie entre le laboratoire Tongyi, Alibaba Cloud, DingTalk, Taotian, etc., chaque équipe travaillant de son côté, avec des ressources dupliquées et des coûts de coordination de plus en plus élevés. La perception des utilisateurs était également floue — Tongyi Qianwen, l’application Qianwen, Quark AI, plusieurs produits utilisant la même technologie, mais les utilisateurs ne pouvaient pas faire la différence.

Il y a seulement 12 jours, le « cerveau » de Qianwen, Lin Junyang, a soudainement quitté son poste, derrière une tension entre « les scientifiques veulent publier des articles » et « la direction veut des revenus ». Ce genre de conflit est courant dans l’industrie de l’IA.

La solution d Wu Yongming est très simple : transformer le Token en un seul et unique « bâton de commandement ». À l’avenir, le système d’évaluation d’Alibaba ne portera plus sur la technique ou la route choisie, mais sera directement basé sur le volume d’appels de Token et les revenus générés. Les départements qui contribuent à la croissance des Tokens seront conservés, ceux qui ne le font pas seront marginalisés.

Une logique plus profonde est que Alibaba estime que toutes les tâches de digitalisation futures seront soutenues par des centaines de milliards d’AI Agents. Wu Yongming a déclaré dans une lettre interne : « Ces AI Agents seront alimentés par des Tokens générés par des modèles. » Et ces Agents, qui ne dorment jamais, fonctionneront 24h/24, ce qui implique une demande continue et à haute fréquence de Tokens.

Si l’on compare le Token à « l’électricité » dans l’ère de l’IA, le rôle des deux géants est clair : NVIDIA est le « fabricant d’équipements de production d’électricité ». Il vend des générateurs, construit des centrales électriques, verrouille ses clients via l’écosystème CUDA, obligeant toutes les applications IA à passer par sa plateforme.

Alibaba est à la fois « le réseau électrique + le gros consommateur ». Il possède le laboratoire Tongyi pour créer des Tokens, une plateforme MaaS pour leur transport, et des produits comme Qianwen et Wukong pour leur consommation. De l’assistant IA côté client à la gestion de flux de travail côté entreprise, Alibaba veut réaliser une boucle complète « production - transport - consommation ».

Qui a l’avantage ? NVIDIA détient une barrière technologique et un verrouillage écologique, avec un coût unitaire de Token nettement inférieur. Alibaba dispose de scénarios et de données — e-commerce, cloud, DingTalk, Amap, Ele.me, générant chaque jour une masse énorme de données (603138), tout en consommant également une quantité massive de Tokens. Si le cycle fermé peut être réalisé, le Token pourra s’auto-circuler et s’auto-valoriser dans l’écosystème Alibaba.

Les géants sont déjà en train de se battre concrètement pour cette voie.

L’avenir du business Token

Ce business consiste essentiellement à transformer la puissance de calcul d’un « actif » en un « service ». Passer d’une vente ponctuelle à une facturation continue. Passer de vendre des outils à vendre du pétrole.

Celui qui maîtrise le coût de production le plus bas de Tokens détient le pouvoir de fixation des prix dans l’ère de l’IA.

NVIDIA, avec ses 20 ans d’écosystème CUDA, ses centaines de millions d’installations, et sa capacité à bénéficier de chaque optimisation logicielle, possède un avantage considérable. Alibaba, avec ses scénarios d’affaires complets et sa volonté stratégique de considérer le Token comme une ressource clé.

Les deux géants partagent la même conviction : le Token est la monnaie dure de l’ère de l’IA. Quant à savoir quand le cours de l’action NVIDIA pourra rebondir, cela dépendra du moment où le marché ne le considérera plus comme une entreprise hardware, mais comme une plateforme d’infrastructure IA valorisée.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler