EN DIRECT en ligne connexion / inscription
Connexion

Surnom/Pseudo
Mot de Passe :

[ Vous avez perdu votre mot de pass ? | Devenir membre ]

×

Test GIGABYTE GeForce RTX 5080 AERO OC SFF 16G : du gris et blanc pour Blackwell !

Article
Vers une AERO coup de coeur ?
Rédigé par
Publié le 30 Janvier 2025
Page: 1/8

Nous commençons notre découverte des versions customs de la RTX 5080 avec la gamme AERO de GIGABYTE, nous fûmes sous le charme lors de sa découverte avec la révision SUPER de la RTX 4080, qu'en est-il quelques mois plus tard ? Notre connivence existe-t-elle toujours ? Le premier échange de regard semble prometteur, il nous reste plus qu'à découvrir les résultats !

La RTX 5080 AERO OC SFF 16G repose sur un GPU GB203, dont la fréquence de base est 2.3 GHz, le Boost est fixé à 2.73 GHz, accompagné de 16 Go de mémoire GDDR7, interfacés en 256-bit. La carte embarque 10752 Cuda Cores, accompagnés de 84 RT Cores et 336 Tensor Cores. Que nous réserve cette version AERO ?

Une fois encore, NVIDIA a créé l’événement et, une fois encore, NVIDIA parle de révolutionner le rendu offert par nos GPU. Enfin, en l’occurrence, par ses GPU, les GB202 et ses dérivés que l’on connaît par le nom de leur architecture, Blackwell. Entre rendu neuronal, DLSS 4 et intelligence artificielle (forcément !), on se fait une plongée dans les méandres techniques des RTX 50.

En premier lieu, posons quelques jalons « chiffrés ». Un GPU comme le GB202 – lequel n’est, comme toujours chez NVIDIA pas la version complète de ce que permet l’architecture Blackwell – intègre tout de même la bagatelle de 92 milliards de transistors sur une surface de 744 millimètres carrés. Il est comme la précédente génération gravée par le numéro un du secteur, TSMC, et emploie le processus 4N FinFET pour une gravure en 4 nanomètres donc.

nvidia blackwell

Continuons sur des chiffres qui, déjà, donnent un peu le tournis. Pour le GB202-400-A1 intégré à la GeForce RTX 5090, on parle effectivement de 21 760 cœurs CUDA soit un accroissement de 33% par rapport aux 16 384 cœurs du GPU de la RTX 4090. Ajoutons à cela que la RTX 5090 profite tout à la fois de plus de mémoire vidéo (32 Go vs 24 Go) et d’un bus mémoire plus performant (512-bit contre 384-bit)., mais les améliorations « matérielles » ne sont pas le cœur de cible de NVIDIA.

nvidia blackwell

NVIDIA est très clair et l’architecture Blackwell se repose les technologies dites neuronales (DLSS en fait bien sûr partie), mais pour en profiter pleinement, plusieurs éléments clés doivent être présents :

  • • les cœurs Tensor de cinquième génération figurent en tête de liste,
  • • les cœurs RT de quatrième génération en sont les compagnons indispensables,
  • • à côté de ça, NVIDIA parle de l’AMP ou AI Management Processor pour organiser les choses,
  • • et des Shader Multiprocessors ou SM qui ont été optimisés pour Blackwell,
  • • enfin, la nouvelle GDDR7 doit apporter performances et fiabilité

nvidia blackwell

5e génération de cœurs Tensor : le FP4 à l’ordre du jour

Chaque génération de cœurs Tensor est évidemment l’occasion d’améliorations notables et de performances en hausse, mais pour cette 5e génération, NVIDIA insiste aussi une efficacité bien plus importante et sur une moindre utilisation de la mémoire. Alors que l’on parle beaucoup de la quantité de mémoire vidéo nécessaire, NVIDIA fait clairement des efforts dans ce sens.

Pour y parvenir, il n’y a pas de miracle, il faut faire des concessions et chez NVIDIA cela revient à prendre en charge le FP4 ou Floating Point 4 bits par rapport aux générations précédentes qui ne pouvaient faire qu’avec le FP16 ou le FP32.

nvidia blackwell

« Pas de miracle » car si on passe d’une précision 16 ou 32 bits à une précision 4 bits, il y a forcément de la perte, mais NVIDIA s’est rendu compte que le jeu en vaut la chandelle : la précision sur 4 bits est suffisante sur de très nombreux scénarios et, notamment, dans les jeux vidéo. Plus important, le FP4 utilisant des formats de données plus petits et impliquant une moindre précision, il faut s’exécuter deux fois plus vite avec une empreinte mémoire largement réduite. Mission accomplie.

4e génération de cœurs RT : des nouveautés moins marquantes

Comme à son habitude, NVIDIA fait évoluer de concert les cœurs Tensor et les cœurs RT, mais de ce que nous avons pu en comprendre – tout cela est tout de même très complexe – les nouveautés sont moins décisives pour ces cœurs RT de 4e génération. On parle par exemple de l’intégration d’un moteur d’intersection de clusters triangulaires spécifiquement conçu pour prendre en charge la méga géométrie laquelle est de plus en plus présente alors que les scènes ray tracing deviennent complètement folles.

nvidia blackwell

Pour ce faire, NVIDIA évoque pas mal de choses, mais nous retiendrons principalement l’intégration d’un nouveau format de compression conçus pour les clusters triangulaires. Il est également question d’un moteur de décompression qui, sans perte, permet de traiter de manière bien plus efficace tout ce qui est méga géométrie justement. Sans surprise, mais il faudra le vérifier en test, NVIDIA souligne que ces progrès apportent une amélioration significative des performances : il avance par exemple un débit doublé pour la gestion des clusters triangulaires par rapport à la génération Ada Lovelace.

GDDR7 : nouveau maître-étalon de l’industrie

Qu’on se le dise, la GDDR6 et ses divers avatars comme la GDDR6X ont vécu. Avec Blackwell, NVIDIA passe à la GDDR7 ce qui, on l’espère ne posera pas de problème de disponibilité à court et moyen terme. Ce nouveau type de mémoire ne révolutionne pas la gestion des données, mais doit d’abord permettre de considérablement augmenter les débits puisque, comme à chaque nouvelle génération de GDDR, on parle d’un doublement de la vitesse.

nvidia blackwell

Mieux, cette accélération notable s’accompagne d’une bien meilleure efficacité énergétique… ça tombe bien, c’était un des chevaux de bataille de NVIDIA sur cette génération. Il faut savoir que par bit de donné transféré, on parle d’une consommation moitié moindre pour la GDDR7 par rapport aux puces de dernière génération de GDDR6. Pas mal. Ce n’est toutefois pas la seule nouveauté et, aux yeux de NVIDIA, le changement le plus important, est le passage à la signalisation PAM3 alors que la GDDR6 exploitait la PAM4. Schématique, le changement porte sur le nombre de niveaux de logique utilisés, on passe assez logiquement de 4 sur la PAM4 à 3 sur la PAM3. Sur le papier, c’est moins bon puisque par cycle d’horloge moins de données sont transférées. Mais, en réalité, on peut alors fonctionner à des vitesses plus élevées pour de meilleures performances globales. NVIDIA a fait ses comptes, vous vous en doutez !

Max-Q : pour plus d’efficacité énergétique ?

La GDDR7 n’est pas la seule des innovations techniques mises en œuvre par NVIDIA pour améliorer l’efficacité énergétique de la génération Blackwell par rapport à la précédente, Ada Lovelace. La documentation technique des RTX 50 met aussi en avant la technologie Max-Q dont on peut dire qu’elle cherche à offrir les meilleures performances possibles tout en restant dans une certaine « enveloppe » de consommation. De plus, NVIDIA souhaite améliorer la gestion énergétique aussi durant les périodes de faible charge.

Max-Q doit permettre d’y parvenir en ajustant de manière bien plus réactive la fréquence d’horloge de la machine. NVIDIA n’y va d’ailleurs pas par quatre chemins en précisant qu’il est question d’une réactivité 1000x supérieure sur Blackwell par rapport à Ada Lovelace. Notons cependant que de tels ajustements sont, comme par le passé, davantage pensés pour le monde des portables : Max-Q ne sera peut-être même pas accessible sur les cartes graphiques desktop.

nvidia blackwell

Max-Q peut compter sur trois piliers pour parvenir à ses fins : le dynamic boost 3.0 est là pour répartir au mieux la puissance énergétique entre le CPU, le GPU et la mémoire vive, bien sûr, en fonction des besoins liés aux tâches en cours. Il va de paire avec le power gating qui gère de manière aussi fine que possible fréquence et tension des cœurs GPU. Enfin, le battery boost est sa troisième composante : l’objectif est ici d’ajuster au mieux la puissance disponible afin de préserver la batterie tout en offrant de (encore) bonnes performances.

Toutes ces fonctionnalités ont leur mot à dire dans l’architecture Blackwell, mais le point le plus important, celui que NVIDIA a le plus mis en avant durant ces présentations est sans doute possible la sortie de DLSS 4. Comme ce fut le cas avec la génération RTX série 40, les RTX série 50 profitent donc de leur DLSS encore que cette quatrième mouture pourra tourner – avec une moindre efficacité – sur les RTX série 40. C’est toujours ça de pris.

DLSS 4 : la révolution multi-frame generation

Du temps des RTX série 40, NVIDIA a fait évoluer DLSS par deux fois avec le frame generation (DLSS 3) puis le ray construction (DLSS 3.5), deux technologies que l’on peut qualifier de complémentaires. Avec DLSS 4, NVIDIA tourne les choses différemment et son approche débute par un postulat : si nous voulons qualité d’image, fluidité de l’animation et réactivité, il faut souvent faire des compromis entre ce que NVIDIA appelle les trois piliers du jeu vidéo en temps réel… Vous vous en doutez, DLSS 4 doit permettre de ne plus faire de compromis ou, en tout cas, le moins possible.

nvidia blackwell

Les transformateurs remplacent le CNN

On ne va pas revenir sur les années d’évolution de DLSS. Aujourd’hui, NVIDIA introduit ce qu’il appelle les « transformateurs » (transformers) lesquels doivent bouleverser les technologies précédentes à base de réseaux neuronaux convolutionnels ou CNN. NVIDIA explique sur les transformateurs utilisent des « mécanismes d’attention » qui doivent permettre de focaliser les ressources de calcul sur les parties les plus importantes des données à traiter. L’idée est alors de mieux gérer les parties les plus complexes d’une scène pour en gérer tous les détails.

nvidia blackwellnvidia blackwell

Plusieurs exemples ont été communiqués par NVIDIA afin de démontrer toute l’efficacité des transformateurs par rapport aux vieillissants CNN. Qu’il s’agisse de cette maison derrière une clôture en grillage ou de ce sac à dos, les détails ressortent effectivement bien davantage pour un rendu plus précis, et ce, que l’on parle de la technologie de ray construction ou de celle de super resolution. De plus, NVIDIA souligne qu’au-delà des détails, les transformateurs doivent aussi permettre une image plus agréable, plus naturelle, même en mouvement.

Le multi-frame generation à la rescousse

Nous connaissions le frame generation qui venait intercaler une image entièrement calculée par l’IA entre deux images rendues par le GPU. Avec les RTX série 50 et DLSS 4, NVIDIA passe la seconde et nous propose le multi-frame generation qui, comme son nom l’indique sans trop d’ambiguïté, vient démultiplier les choses. L’IA ne se charge donc plus ici d’insérer une image, mais génère trois images supplémentaires pour deux images effectivement rendues par le GPU. NVIDIA s’amuse à dire qu’au total 15 pixels sur 16 sont maintenant générés par l’IA ce qui, bien sûr, conduit à une augmentation de l’efficacité du rendu par un facteur 8. Rien que ça !

nvidia blackwellnvidia blackwell

NVIDIA aimant décidément bien les chiffres, nous en avons plusieurs pour les amateurs : la multi-frame generation ne se contente pas de ces 15 pixels sur 16, elle le fait avec un modèle de génération d’images par l’IA 40 % plus rapide et capable de bien davantage économiser la mémoire vidéo : on parle là de 30 % d’économie tout de même. Sur Cyberpunk 2077 – un de ses jeux favoris – NVIDIA boit du petit lait : on passe de 27 ips avec 70 ms sans DLSS, à 70 ips/35 ms en DLSS, 140 ips/35 ms en DLSS 3.5 et carrément 248 ips en DLSS 4 tout en gardant une latence autour des 34 ms. Mieux, la qualité d’image serait améliorée… toujours selon NVIDIA bien sûr.

nvidia blackwellnvidia blackwell

De fait, NVIDIA peut parler de performances jusqu’à 8 fois supérieures grâce au multi-frame generation de DLSS 4 tout en offrant un meilleur rendu visuel. Bien sûr, si Cyberpunk 2077 est l’exemple favori de NVIDIA, la firme au caméléon a donné d’autres exemples parmi les jeux les plus récents : Alan Wake 2, Black Myth: Wukong, Frostpunk 2, Hitman World of Assassination, Hogwarts Legacy. À chaque fois, les performances s’envolent même si le facteur 8 n’est plus toujours de mise, on reste – dans le pire des cas (Hitman World of Assassination) à un facteur de 4,7.

nvidia blackwell

Reste maintenant la question de l’adoption de la technologie. Un point sur lequel NVIDIA s’est voulu rassurant en évoquant « 75 jeux et applications » compatibles DLSS 4 dès la sortie et, bien sûr, une adoption qui devrait s’accélérer très rapidement. De plus, NVIDIA explique que la compatibilité avec DLSS 3/DLSS 3.5 est assurée afin que le travail d’intégration soit plus simple pour les développeurs et il est aussi intéressant de noter DLSS 4 n’est pas strictement réservé aux RTX série 50.

nvidia blackwell

Entendons-nous, le multi-frame generation demandera un GPU RTX série 50. Là, il n’y a pas à tortiller et NVIDIA l’explique par le besoin des cœurs Tensor de 5e génération par exemple. En revanche, les améliorations dans la qualité de la génération d’images sera elle accessible à d’autres GPU. Oh, pas n’importe lesquels vous vous en doutez : seuls les GeForce RTX série 40 pourront en profiter, mais ça reste un point intéressant qui devrait, là encore, favoriser l’adoption de la technologie.

Reflex 2 : lutter contre la latence, toujours

Souvenez-vous, au moment d’annoncer DLSS 3 et son frame generation, NVIDIA avait indiqué que sa Reflex était indispensable pour éviter une augmentation trop nette de la latence système : de part son fonctionnement même – il doit attendre le rendu de l’image suivante pour générer son image – DLSS 3 entraîne une augmentation de la latence. Reflex faisait plutôt bien le boulot pour justement contrer ce défaut, mais vous vous en doutez, le problème est plus crucial encore avec DLSS 4 puisqu’on parle de générer trois images toutes les deux rendues par le GPU.

nvidia blackwellnvidia blackwell

Le lancement de DLSS 4 s’accompagne donc de celui de Reflex 2 qui, une fois encore il s’agit d’un chiffre officiel NVIDIA, permet une amélioration de la latence de 75 % par rapport à Reflex. Comment ? Grâce à une technologie que NVIDIA baptisé frame warp et qui doit permettre une synchronisation encore plus efficace entre le CPU et le GPU. L’idée est alors de surveiller les impulsions envoyées par l’utilisateur afin de mettre à jour – en temps réel – la position de la caméra par rapport à ces impulsions.

nvidia blackwell

Accrochez-vous bien, NVIDIA explique que sa technologie prend en compte ses impulsions et transforme l’intégration de l’image – c’est le inpainting de la capture ci-dessus – afin d’ajuster les choses en fonction de la position du curseur de la souris par exemple. Ensuite seulement, l’image ainsi modifiée est envoyée à l’écran pour être affichée ! Pour être tout à fait honnête, les explications données par NVIDIA n’ont pas toutes été parfaitement claires à ce niveau, mais le résultat semble devoir être au rendez-vous. À vérifier bien sûr.

Partagez :
Marques : GIGABYTENVIDIA
Nos partenaires :