Électricité chinoise, Token à l'internationalization

PANews
BTC4,9%

Auteur : Black Lobster, Deep Tide TechFlow

En été 1858, un câble en cuivre traversant l’Atlantique sous-marin reliait Londres à New York.

L’importance de cet événement n’a jamais été la vitesse de transmission, mais la structure de pouvoir : celui qui pose le câble sous-marin peut siphonner le flux d’informations. L’Empire britannique, grâce à ce réseau mondial de télégraphes, tenait dans ses mains le renseignement colonial, le prix du coton, les nouvelles de guerre.

La puissance de l’empire ne reposait pas seulement sur sa flotte, mais aussi sur ce câble.

Plus de cent soixante ans plus tard, cette logique se répète de manière inattendue.

En 2026, les grands modèles chinois commencent discrètement à dominer le marché mondial des développeurs. Selon les dernières données d’OpenRouter, 61 % des tokens consommés par les dix principaux modèles de la plateforme proviennent de modèles chinois, dont les trois premiers sont entièrement chinois. Les requêtes API quotidiennes des développeurs de San Francisco, Berlin, Singapour traversent le câble sous-marin du Pacifique pour atteindre les centres de données en Chine, où la puissance de calcul est consommée, l’électricité circule, et le résultat revient.

L’électricité n’a jamais quitté le réseau électrique chinois, mais sa valeur est livrée transfrontalièrement via les tokens.

La grande migration des modèles d’IA

Le 24 février 2026, OpenRouter publie une donnée hebdomadaire : environ 8,7 trillions de tokens consommés par les dix principaux modèles, dont 5,3 trillions par des modèles chinois, soit 61 %. MiniMax M2.5 domine avec 2,45 trillions de tokens, Kimi K2.5 et Zhìpǔ GLM-5 suivent, tous deux chinois.

Dernières données du 26 février

Ce n’est pas une coïncidence, un déclencheur a tout mis en marche.

Au début de l’année, OpenClaw apparaît soudainement, un outil open source permettant à l’IA de réellement « travailler » : contrôler directement un ordinateur, exécuter des commandes, réaliser en parallèle des workflows complexes. En quelques semaines, ses étoiles sur GitHub dépassent 210 000.

Les professionnels de la finance, comme John, installent immédiatement OpenClaw, connectent l’API d’Anthropic, et commencent à surveiller automatiquement le marché boursier, envoyant des signaux de trading. Quelques heures plus tard, il regarde son solde : quelques dizaines de dollars, tout disparu.

C’est la nouvelle réalité apportée par OpenClaw. Avant, converser avec une IA coûtait quelques tokens, négligeables. Après, l’IA exécute simultanément plusieurs sous-tâches en arrière-plan, en boucle, consommant des tokens de façon exponentielle. La facture s’accélère comme une voiture sous le capot, le compteur d’essence baisse, impossible de s’arrêter.

Dans la communauté des développeurs, une « astuce » circule : utiliser un jeton OAuth pour relier directement le compte d’abonnement d’Anthropic ou de Google à OpenClaw, transformant la limite mensuelle « illimitée » en carburant gratuit pour l’agent IA, méthode adoptée par beaucoup.

Les contre-mesures officielles suivent.

Le 19 février, Anthropic met à jour ses conditions, interdisant explicitement l’utilisation des abonnements Claude pour des outils tiers comme OpenClaw. Pour accéder aux fonctionnalités de Claude, il faut passer par le canal de facturation API. Google, de son côté, a massivement bloqué les comptes d’abonnement via OpenClaw pour accéder à Antigravity et Gemini AI Ultra.

« La longue souffrance du Qin est terminée », John se tourne alors vers les grands modèles nationaux.

Sur OpenRouter, le score en tâches d’ingénierie logicielle du modèle chinois MiniMax M2.5 est de 80,2 %, celui de Claude Opus est de 80,8 %, la différence est négligeable. Mais le prix est radicalement différent : 0,3 dollar par million de tokens pour le premier, 5 dollars pour le second, soit un écart d’environ 17 fois.

John change de modèle, le workflow continue, la facture diminue d’un ordre de grandeur. Cette migration se produit simultanément à l’échelle mondiale.

Chris Clark, COO d’OpenRouter, explique franchement : les modèles open source chinois ont conquis une part de marché importante parce qu’ils sont extrêmement présents dans les workflows d’agents opérés par des développeurs américains.

L’exportation de l’électricité

Pour comprendre la véritable nature de l’exportation de tokens, il faut d’abord saisir la structure de coût d’un token.

Il paraît léger : un token équivaut à environ 0,75 mot en anglais. Une conversation ordinaire avec une IA consomme quelques milliers de tokens. Mais quand ces tokens s’accumulent en trillions, la réalité physique devient lourde.

Le coût de chaque token repose essentiellement sur deux éléments : la puissance de calcul et l’électricité.

La puissance de calcul correspond à l’amortissement des GPU. Acheter une H100 Nvidia coûte environ 30 000 dollars, sa durée de vie en inférence correspond à l’amortissement. L’électricité est le carburant du centre de données : chaque GPU en charge consomme environ 700 watts, plus le refroidissement. La facture électrique annuelle d’un grand centre d’IA peut facilement dépasser plusieurs centaines de millions de dollars.

Tracez cette réalité sur une carte.

Un développeur américain envoie une requête API depuis San Francisco. Les données traversent le câble sous-marin du Pacifique, atteignent un centre de données en Chine, où un cluster GPU commence à travailler. L’électricité circule du réseau chinois vers les puces, la déduction s’achève, et le résultat revient. Tout cela en une ou deux secondes.

L’électricité n’a jamais quitté le réseau chinois, mais sa valeur, via les tokens, a été livrée transfrontalièrement.

Il y a là une magie que le commerce traditionnel ne peut égaler : les tokens n’ont pas de forme physique, ne passent pas par la douane, ne sont pas soumis aux taxes, et ne figurent dans aucune statistique commerciale officielle. La Chine exporte massivement des services de calcul et d’électricité, mais dans les données commerciales officielles, c’est presque invisible.

Les tokens sont devenus des dérivés de l’électricité, leur exportation est en réalité une exportation d’électricité.

Cela profite aussi de la faiblesse des prix de l’électricité en Chine, dont le coût global est inférieur d’environ 40 % à celui des États-Unis, une différence physique facilement réplicable par la concurrence.

De plus, les grands modèles chinois disposent aussi d’avantages en algorithmes et en « internalisation ».

DeepSeek V3, avec son architecture MoE, n’active qu’une partie des paramètres lors de l’inférence. Des tests indépendants montrent que ses coûts sont environ 36 % inférieurs à ceux de GPT-4o. MiniMax M2.5, avec ses 229 milliards de paramètres, n’en active que 10 milliards.

Au sommet, la « surenchère » : Alibaba, ByteDance, Baidu, Tencent, Moon Shadow, Zhìpǔ, MiniMax… une dizaine d’entreprises se livrent une compétition féroce, les prix ont déjà plongé en dessous du seuil de rentabilité, faire du profit n’est plus la priorité, la perte est devenue la norme.

En regardant de près, c’est comme l’exportation chinoise de produits manufacturés : en utilisant leur chaîne d’approvisionnement et leur internalisation, ils ont fortement abaissé le prix du token.

De Bitcoin à Token

Avant les tokens, il y eut une autre forme d’exportation d’électricité.

Vers 2015, les gestionnaires de centrales électriques du Sichuan, du Yunnan et du Xinjiang ont commencé à accueillir des visiteurs étranges.

Ces gens louaient des usines abandonnées, y installaient des machines, et faisaient fonctionner 24h/24. Ces machines ne produisaient rien, sauf une seule chose : résoudre un problème mathématique infini, pour parfois en tirer un bitcoin.

C’était la première forme d’exportation d’électricité : utiliser l’électricité bon marché — hydroélectrique et éolienne — via des machines de minage pour convertir cette énergie en actifs numériques mondiaux, puis les échanger contre des dollars.

L’électricité ne franchissait aucune frontière, mais sa valeur, via le bitcoin, circulait dans le marché mondial.

Pendant ces années, la puissance de calcul chinoise représentait plus de 70 % du total mondial de minage de bitcoin. L’hydroélectricité et le charbon chinois, par cette voie détournée, participaient à une redistribution mondiale des capitaux.

En 2021, tout s’arrête brutalement. La régulation frappe fort, les mineurs dispersés, la puissance de calcul migrée vers le Kazakhstan, le Texas et le Canada.

Mais cette logique n’a jamais disparu, elle attendait simplement un nouveau support. Jusqu’à l’émergence de ChatGPT, avec ses grands modèles concurrents, où d’anciennes mines de bitcoin se sont transformées en centres de données IA, les machines de minage en GPU de puissance, et les bitcoins en tokens. La seule constante : l’électricité.

Le bitcoin et le token partagent une logique fondamentale : tous deux sont des constructions basées sur la puissance de calcul. Mais aujourd’hui, le token a une valeur commerciale plus tangible.

Le minage de bitcoin est une simple opération mathématique, le bitcoin en tant qu’actif financier tire sa valeur de sa rareté et de l’accord du marché, sans lien avec la « puissance de calcul » en soi. La puissance de calcul n’a pas de productivité intrinsèque, c’est plutôt un mécanisme de confiance.

Les grands modèles d’IA, eux, produisent une véritable valeur : des services cognitifs, du code, des analyses, des traductions, de la créativité. La valeur du token provient directement de son utilité pour l’utilisateur. C’est une intégration plus profonde : une fois qu’un workflow de développeur dépend d’un modèle, le coût de changement augmente avec le temps.

Une différence clé : le minage de bitcoin a été expulsé de Chine, tandis que l’exportation de tokens est une décision volontaire des développeurs mondiaux.

La guerre des tokens

Le câble sous-marin posé en 1858 symbolisait la souveraineté de l’Empire britannique sur l’autoroute de l’information : celui qui possède l’infrastructure peut définir les règles du jeu.

L’exportation de tokens est aussi une guerre sans déclaration, avec ses résistances.

La souveraineté des données est le premier mur : une requête API d’un développeur américain traitée par un centre de données chinois implique que les données traversent physiquement la Chine. Pour un développeur individuel ou une petite application, ce n’est pas un problème. Mais pour des données sensibles d’entreprise, financières ou gouvernementales, c’est une faille. C’est pourquoi la pénétration des modèles chinois dans les outils de développement et les applications personnelles est forte, mais leur présence dans les systèmes critiques des entreprises est quasi inexistante.

Les interdictions sur les puces constituent un second mur : la Chine fait face à des restrictions à l’exportation des GPU haut de gamme Nvidia. Les architectures MoE et les optimisations algorithmiques ne peuvent qu’atténuer partiellement cette faiblesse, mais le plafond existe toujours.

Mais ces obstacles ne sont que le prélude à une bataille plus grande.

Les tokens et les modèles d’IA sont devenus un nouveau champ de confrontation stratégique entre la Chine et les États-Unis, rivalisant avec la course aux semi-conducteurs ou à Internet du XXe siècle, voire s’apparentant à une métaphore plus ancienne : la course à l’espace.

En 1957, l’URSS lance Spoutnik, provoquant un choc aux États-Unis. Rapidement, le programme Apollo est lancé, mobilisant des milliards de dollars pour ne pas laisser la suprématie spatiale à l’adversaire.

La logique de la compétition IA est étonnamment similaire, mais avec une intensité bien supérieure : l’espace est un espace physique, invisible pour le grand public. L’IA infiltre les vaisseaux sanguins de l’économie : chaque ligne de code, chaque contrat, chaque système décisionnel gouvernemental peut contenir un modèle national. Celui dont le modèle devient l’infrastructure de référence mondiale, détient une influence structurelle sur l’économie numérique globale.

C’est précisément ce qui inquiète Washington face à l’expansion des tokens chinois.

Quand un développeur construit sa bibliothèque de code, son workflow d’agent, ou sa logique produit autour d’un API chinois, le coût de migration croît exponentiellement avec le temps. Même si les législations américaines limitent ces échanges, les développeurs résisteront de toutes leurs forces, comme ils ne peuvent aujourd’hui abandonner GitHub.

Le lancement de cette guerre par les tokens n’est peut-être que le début d’un long combat. La Chine n’a pas revendiqué vouloir tout bouleverser. Elle offre simplement, à moindre coût, ses services à chaque développeur dans le monde, via une API.

Cette fois, ce sont les équipes de codeurs de Hangzhou, Beijing, Shanghai, et les clusters GPU tournant jour et nuit dans un province du sud, qui ont posé le câble.

Ce combat n’a pas de compte à rebours : il se déroule 24h/24, chaque jour, en tokens, sur chaque terminal de développeur.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire