Comment les Nvidia GeForce RTX 4000 arrivent à quadrupler leurs performances

Grâce à Ada Lovelace et au DLSS 3

 

À l'occasion de l'évènement GeForce Beyond, Nvidia dévoile l'architecture GPU Ada Lovelace, la puce qui est intégrée aux GeForce RTX 4090 et 4080. Au programme : une gravure plus fine, l'arrivée du DLSS 3 et des dizaines de nouveaux milliards de transistors. De quoi augmenter considérablement les performances dans les jeux vidéo.

À l’occasion de son évènement GeForce Beyond et du lancement des GeForce RTX 4090 et 4080, Nvidia lève le voile sur sa nouvelle architecture Ada Lovelace. C’est cette architecture qui est intégrée aux nouvelles GeForce RTX 4090 et 4080. La grande nouveauté, c’est la finesse de gravure qui passe de 8 nm à 4 nm. Dans le détail, il s’agit du process de gravure TSMC 4N.

Une efficacité énergétique doublée

Une finesse de gravure qui permet de grimper à un total de 76 milliards de transistors sur la puce permettant d’intégrer plus de 18 000 cœurs CUDA. À comparer aux 28 milliards de transistors de l’architecture Ampere des GeForce RTX 3000. La mémoire vive utilise la technologie GDDR6X, comme l’ancienne architecture dévoilée en 2020 et n’utilise donc toujours pas la mémoire HBM empilée comme chez son concurrent AMD.

Nvivia annonce une efficacité énergétique doublée sur les GPU Ada Lovelace des GeForce RTX 4000 comparé à l’ancienne architecture Ampere des GeForce RTX 3000.

Le traitement des shaders évolue avec de nouveaux multiprocesseurs de streaming. Ceux-ci bénéficieraient ainsi d’une efficacité énergétique deux fois plus importante qu’auparavant, avec une puissance de 83 TeraFLOPs sur les shaders, contre 40 TeraFLOPs sur l’architecture Ampere. Le ray tracing évolue lui aussi, avec des cœurs de troisième génération, permettant d’atteindre une puissance de 191 TeraFLOPs sur le ray tracing. Il fallait compter sur une puissance de 78 TeraFLOPs pour les GeForce RTX 3000.

Enfin, le deep learning a, lui aussi, droit à des améliorations, avec des cœurs Tensor de quatrième génération. De quoi passer d’une puissance de 320 TeraFLOPs à 1 320 TeraFLOPs sur Ada Lovelace en utilisant l’accélération FP8.

Au total, l’architecture Ada Lovelace serait très gourmande en énergie, avec une puissance qui pourrait atteindre 450 watts pour le GPU le plus puissant, contre 350 watts pour l’architecture Ampere

Des performances en ray-tracing à la hausse

On peut également citer la nouvelle fonction Shader Execution Reordering (SER) qui « améliore l’efficacité d’exécution en réordonnançant les charges de travail de shading à la volée pour mieux utiliser les ressources du GPU ». Nvidia promet ainsi une amélioration des performances ray tracing « jusqu’à 3x et le nombre d’images dans les jeux jusqu’à 25 % ».

DLSS 3 : LA fonction à ne pas manquer

L’autre grande nouveauté, c’est l’arrivée de DLSS 3. Présentée par Nvidia comme « la prochaine révolution de la technologie graphique neuronale Deep Learning Super Sampling de la société pour les jeux ». Il s’agit d’une évolution majeure du DLSS 2 utilisant l’IA pour accélérer les calculs dans les jeux gourmands. Nvivia a pris l’exemple de Cyberpunk 2077 qui passe de 62 FPS en 4K en DLSS 2 à 101 FPS en DLSS 3, grâce à l’accélérateur de flux optique Ada, deux fois plus rapides selon la firme américaine.

Dans la pratique, en plus d’upscaler la définition des images comme le fait le DLSS 2, le DLSS 3 va encore plus loin. La fonctionnalité crée de nouvelles images et les intercale aux frames existantes. Le résultat : le compteur d’IPS (images par seconde) grimpe, permettant ainsi d‘augmenter le nombre d’images affichées à l’écran, et donc la fluidité du jeu.

Cela fonctionne même sur des titres limités par les performances du processeur (on utilise l’expression CPU limited ou CPU bound), ce qui explique les écarts de performances annoncés par Nvidia avec cette nouvelle architecture.

L’autre grande nouvelle, c’est le remastering de Portal avec le DLSS, dénommé Portal with RTX, gratuit pour les possesseurs de Portal.

Nvidia aborde aussi le cas de l’édition vidéo et des streameurs avec l’intégration de nouveaux encodeurs AV1 de huitième génération : il en a deux en parallèle. L’efficacité de l’encodage aurait été augmentée de 40 %. Ce qui signifierait une hausse de la qualité visuelle pour le même débit.

GeForce RTX 3000 vs RTX 4000 : les performances

Finalement, Nvidia annonce des performances quatre fois plus élevées des GeForce RTX 4090 face à la GeForce RTX 3090 Ti sur Cyberpunk 2077, et deux fois plus élevées pour Microsoft Flight Simulator et Warhammer 40 000 : Darktide. Tout cela grâce à la nouvelle architecture, mais également grâce au DLSS 3, exclusif à cette nouvelle architecture Ada Lovelace.

Pour finir, voici un graphique récapitulant les performances sur Resident Evil Village, Assasin’s Creed Valhalla, The Division 2, Warhammer 40 000 : Darktide, Microsoft Flight Simulator, Portal et Cyberpunk 2077 avec les RTX 3090 Ti, RTX 4080 (12 Go), RTX 4080 (16 Go) et RTX 4090.