Nvidia : ultra puissante, la première puce graphique Ampère se dévoile

Avec l'ambition de « révolutionner l'intelligence artificielle et le calcul »

 

Nvidia a tenu cette après-midi sa conférence GTC, l'occasion pour la marque au caméléon de dévoiler sa puce A100, la première à profiter de la nouvelle architecture Ampère et de la gravure en 7 nm. Destinée au monde professionnel, elle donnera bientôt lieu à des moutures grand public qui animeront les nouvelles GeForce RTX.

Voici la Tesla A100, la première puce de nouvelle génération de Nvidia // Source : Nvidia

Pensé pour l’intelligence artificielle, l’inférence et plus globalement le monde de l’entreprise et des serveurs, la Tesla A100 est la première puce GPU de nouvelle génération signée Nvidia. Basée sur l’architecture Ampère mais aussi sur la gravure en 7 nm de TSMC, cette puce s’annonce comme la première d’une génération de GPUs qui se déclinera prochainement sur le marché grand public pour donner vie aux GeForce RTX 3000, pressenties à la rentrée. Ses principales caractéristiques nous donnent des indices sur les spécifications que l’on peut attendre de la RTX 3080 Ti, notamment.

La nouvelle génération de cartes graphiques s’annonce féroce

Comme le souligne CRN, Nvidia parle tout simplement du plus gros bond technologique effectué en huit générations de cartes graphiques. Le passage à la gravure en 7 nm (au lieu du 12 nm employé jusqu’à présent) permet notamment aux verts d’ajouter pas moins de 54 milliards de transistors sur le die de 826 mm2 de son A100. Il s’agit selon Nvidia du plus gros GPU 7 nm jamais créé, n’en déplaise à AMD qui exploite aussi le procédé de gravure en 7 nm de TSMC pour ses cartes graphiques professionnelles (comme la récente Radeon Pro VII) et grand public.

Pour des calculs plus rapides, permis grâce à l’IA, Nvidia se base sur des Tensor Cores de troisième génération. La particularité première de l’A100 est néanmoins sa capacité à se partitionner pour lancer en parallèle jusqu’à 7 instances GPU capables de travailler en simultanée. Une fonctionnalité cruciale en calcul et donc pour le monde professionnel, mais qui pourrait aussi profiter, en jeu, aux RTX 3000. Cette particularité de l’architecture pourrait d’ailleurs expliquer les rumeurs évoquant des performances jusqu’à 70% supérieures à celles d’une RTX 2080 Ti sur les jeux optimisés spécifiquement pour Ampère.

200 000 dollars le lot de huit puces A100

De manière plus terre à terre, l’A100 embarque 3456 cores CUDA FP64 (double-precision floating point, pour le calcul lourd), 6912 cores CUDA FP32, 432 Tensor Cores, 108 multiprocesseurs de flux et pas moins de 40 Go de mémoire vidéo. Sans surprise, la consommation est à la hauteur de ces spécifications, avec une enveloppe thermique estimée à un maximum de 400 watts.

Déjà en production de masse, a précisé Nvidia, l’A100 pourra notamment être livrée par lot de huit sur un système baptisé DGX A100 (disponible dès à présent). Un système proposé à 200 000 dollars… et qui reposera pour l’anecdote sur des puces AMD « Rome » pour le volet CPU.

Les derniers articles