tadata
Retour à l'accueil

Le paysage du calcul IA : GPU, TPU, silicium personnalisé et économies d'échelle

#artificial-intelligence#hardware#cloud#infrastructure

Le calcul est la contrainte limitante de l'IA moderne. Le choix du matériel — et la manière dont il est provisionné — détermine quels modèles peuvent être entraînés, à quel coût, et à quelle vitesse l'inférence peut être servie.

Tableau comparatif du matériel

PuceFournisseurMémoireBP mémoireFP16 TFLOPSUsage principal
H100 SXMNVIDIA80 Go HBM33,35 To/s989Entraînement + inférence
H200 SXMNVIDIA141 Go HBM3e4,8 To/s989Grands modèles
B200NVIDIA192 Go HBM3e8 To/s2 250Nouvelle génération
TPU v5pGoogle95 Go HBM2,76 To/s~459Entraînement JAX/TF
Trainium2AWS96 Go HBM3,2 To/s~740 (est.)Entraînement optimisé en coût
MI300XAMD192 Go HBM35,3 To/s1 307Entraînement + inférence

Comparaison des prix GPU cloud (à la demande, par heure)

GPUAWSGCPAzureCoreWeave
H100 80 Go12,00 $11,60 $11,56 $2,49 $
A100 80 Go5,12 $5,07 $3,67 $1,35 $
L40,81 $0,81 $0,72 $N/A
TPU v5pN/A4,20 $/puceN/AN/A

Note : les tarifs GPU cloud sont très dynamiques. Les prix spot/préemptibles peuvent être inférieurs de 50 à 70 %.

Entraînement vs inférence : des stratégies matérielles différentes

L'entraînement requiert une mémoire massive (modèle + optimiseur + gradients), un calcul soutenu et un interconnect critique. L'inférence est en rafales, sensible à la latence, et bénéficie massivement de la quantification (INT8/INT4/FP8).

Considérations stratégiques

Le paysage matériel favorise les organisations capables de planifier leur stratégie de calcul sur trois horizons : immédiat (quels GPU cloud réserver), moyen terme (quelles filières de silicium personnalisé évaluer) et long terme (quels paris architecturaux suivre). Les écarts de coût de l'ordre de 10× entre fournisseurs et générations de puces font de la stratégie de calcul une décision de niveau direction.

Ressources

Nous utilisons des cookies analytiques pour améliorer votre expérience. Aucune donnée personnelle n'est collectée.