Les GPU Nvidia Blackwell coûtent deux fois plus cher, mais le coût d’inférence par token baisse de 35 fois par rapport à Hopper
Selon l’analyse du dernier billet de blog de Nvidia, les GPU Blackwell coûtent presque deux fois plus cher par heure que la génération Hopper, mais offrent des coûts d’inférence par jeton 35 fois plus faibles. En utilisant DeepSeek-R1 comme modèle de test, Blackwell (GB300 NVL72) se loue à 2,65 dollars par GPU et par heure contre 1,41 pour Hopper, mais un GPU unique
Il y a 2m