Pourquoi et comment désactiver Adblocks uniquement pour cowcotland.com ?

Derniers tests :

Dernières vidéos :

Test GIGABYTE GeForce RTX 5080 AERO OC SFF 16G : du gris et blanc pour Blackwell !

Article

Vers une AERO coup de coeur ?

R�dig� par Jonathan Riemain
Publi� le 30 Janvier 2025
Page: 1/8

Nous commen�ons notre d�couverte des versions customs de la RTX 5080 avec la gamme AERO de GIGABYTE, nous f�mes sous le charme lors de sa d�couverte avec la r�vision SUPER de la RTX 4080, qu'en est-il quelques mois plus tard ? Notre connivence existe-t-elle toujours ? Le premier �change de regard semble prometteur, il nous reste plus qu'� d�couvrir les r�sultats !

La RTX 5080 AERO OC SFF 16G repose sur un GPU GB203, dont la fr�quence de base est 2.3 GHz, le Boost est fix� � 2.73 GHz, accompagn� de 16 Go de m�moire GDDR7, interfac�s en 256-bit. La carte embarque 10752 Cuda Cores, accompagn�s de 84 RT Cores et 336 Tensor Cores. Que nous r�serve cette version AERO ?

Une fois encore, NVIDIA a cr�� l��v�nement et, une fois encore, NVIDIA parle de r�volutionner le rendu offert par nos GPU. Enfin, en l�occurrence, par ses GPU, les GB202 et ses d�riv�s que l�on conna�t par le nom de leur architecture, Blackwell. Entre rendu neuronal, DLSS 4 et intelligence artificielle (forc�ment !), on se fait une plong�e dans les m�andres techniques des RTX 50.

En premier lieu, posons quelques jalons � chiffr�s �. Un GPU comme le GB202 � lequel n�est, comme toujours chez NVIDIA pas la version compl�te de ce que permet l�architecture Blackwell � int�gre tout de m�me la bagatelle de 92 milliards de transistors sur une surface de 744 millim�tres carr�s. Il est comme la pr�c�dente g�n�ration grav�e par le num�ro un du secteur, TSMC, et emploie le processus 4N FinFET pour une gravure en 4 nanom�tres donc.

Continuons sur des chiffres qui, d�j�, donnent un peu le tournis. Pour le GB202-400-A1 int�gr� � la GeForce RTX 5090, on parle effectivement de 21 760 c�urs CUDA soit un accroissement de 33% par rapport aux 16 384 c�urs du GPU de la RTX 4090. Ajoutons � cela que la RTX 5090 profite tout � la fois de plus de m�moire vid�o (32 Go vs 24 Go) et d�un bus m�moire plus performant (512-bit contre 384-bit)., mais les am�liorations � mat�rielles � ne sont pas le c�ur de cible de NVIDIA.

NVIDIA est tr�s clair et l�architecture Blackwell se repose les technologies dites neuronales (DLSS en fait bien s�r partie), mais pour en profiter pleinement, plusieurs �l�ments cl�s doivent �tre pr�sents :

� les c�urs Tensor de cinqui�me g�n�ration figurent en t�te de liste,
� les c�urs RT de quatri�me g�n�ration en sont les compagnons indispensables,
� � c�t� de �a, NVIDIA parle de l�AMP ou AI Management Processor pour organiser les choses,
� et des Shader Multiprocessors ou SM qui ont �t� optimis�s pour Blackwell,
� enfin, la nouvelle GDDR7 doit apporter performances et fiabilit�

5e g�n�ration de c�urs Tensor : le FP4 � l�ordre du jour

Chaque g�n�ration de c�urs Tensor est �videmment l�occasion d�am�liorations notables et de performances en hausse, mais pour cette 5e g�n�ration, NVIDIA insiste aussi une efficacit� bien plus importante et sur une moindre utilisation de la m�moire. Alors que l�on parle beaucoup de la quantit� de m�moire vid�o n�cessaire, NVIDIA fait clairement des efforts dans ce sens.

Pour y parvenir, il n�y a pas de miracle, il faut faire des concessions et chez NVIDIA cela revient � prendre en charge le FP4 ou Floating Point 4 bits par rapport aux g�n�rations pr�c�dentes qui ne pouvaient faire qu�avec le FP16 ou le FP32.

� Pas de miracle � car si on passe d�une pr�cision 16 ou 32 bits � une pr�cision 4 bits, il y a forc�ment de la perte, mais NVIDIA s�est rendu compte que le jeu en vaut la chandelle : la pr�cision sur 4 bits est suffisante sur de tr�s nombreux sc�narios et, notamment, dans les jeux vid�o. Plus important, le FP4 utilisant des formats de donn�es plus petits et impliquant une moindre pr�cision, il faut s�ex�cuter deux fois plus vite avec une empreinte m�moire largement r�duite. Mission accomplie.

4e g�n�ration de c�urs RT : des nouveaut�s moins marquantes

Comme � son habitude, NVIDIA fait �voluer de concert les c�urs Tensor et les c�urs RT, mais de ce que nous avons pu en comprendre � tout cela est tout de m�me tr�s complexe � les nouveaut�s sont moins d�cisives pour ces c�urs RT de 4e g�n�ration. On parle par exemple de l�int�gration d�un moteur d�intersection de clusters triangulaires sp�cifiquement con�u pour prendre en charge la m�ga g�om�trie laquelle est de plus en plus pr�sente alors que les sc�nes ray tracing deviennent compl�tement folles.

Pour ce faire, NVIDIA �voque pas mal de choses, mais nous retiendrons principalement l�int�gration d�un nouveau format de compression con�us pour les clusters triangulaires. Il est �galement question d�un moteur de d�compression qui, sans perte, permet de traiter de mani�re bien plus efficace tout ce qui est m�ga g�om�trie justement. Sans surprise, mais il faudra le v�rifier en test, NVIDIA souligne que ces progr�s apportent une am�lioration significative des performances : il avance par exemple un d�bit doubl� pour la gestion des clusters triangulaires par rapport � la g�n�ration Ada Lovelace.

GDDR7 : nouveau ma�tre-�talon de l�industrie

Qu�on se le dise, la GDDR6 et ses divers avatars comme la GDDR6X ont v�cu. Avec Blackwell, NVIDIA passe � la GDDR7 ce qui, on l�esp�re ne posera pas de probl�me de disponibilit� � court et moyen terme. Ce nouveau type de m�moire ne r�volutionne pas la gestion des donn�es, mais doit d�abord permettre de consid�rablement augmenter les d�bits puisque, comme � chaque nouvelle g�n�ration de GDDR, on parle d�un doublement de la vitesse.

Mieux, cette acc�l�ration notable s�accompagne d�une bien meilleure efficacit� �nerg�tique� �a tombe bien, c��tait un des chevaux de bataille de NVIDIA sur cette g�n�ration. Il faut savoir que par bit de donn� transf�r�, on parle d�une consommation moiti� moindre pour la GDDR7 par rapport aux puces de derni�re g�n�ration de GDDR6. Pas mal. Ce n�est toutefois pas la seule nouveaut� et, aux yeux de NVIDIA, le changement le plus important, est le passage � la signalisation PAM3 alors que la GDDR6 exploitait la PAM4. Sch�matique, le changement porte sur le nombre de niveaux de logique utilis�s, on passe assez logiquement de 4 sur la PAM4 � 3 sur la PAM3. Sur le papier, c�est moins bon puisque par cycle d�horloge moins de donn�es sont transf�r�es. Mais, en r�alit�, on peut alors fonctionner � des vitesses plus �lev�es pour de meilleures performances globales. NVIDIA a fait ses comptes, vous vous en doutez !

Max-Q : pour plus d�efficacit� �nerg�tique ?

La GDDR7 n�est pas la seule des innovations techniques mises en �uvre par NVIDIA pour am�liorer l�efficacit� �nerg�tique de la g�n�ration Blackwell par rapport � la pr�c�dente, Ada Lovelace. La documentation technique des RTX 50 met aussi en avant la technologie Max-Q dont on peut dire qu�elle cherche � offrir les meilleures performances possibles tout en restant dans une certaine � enveloppe � de consommation. De plus, NVIDIA souhaite am�liorer la gestion �nerg�tique aussi durant les p�riodes de faible charge.

Max-Q doit permettre d�y parvenir en ajustant de mani�re bien plus r�active la fr�quence d�horloge de la machine. NVIDIA n�y va d�ailleurs pas par quatre chemins en pr�cisant qu�il est question d�une r�activit� 1000x sup�rieure sur Blackwell par rapport � Ada Lovelace. Notons cependant que de tels ajustements sont, comme par le pass�, davantage pens�s pour le monde des portables : Max-Q ne sera peut-�tre m�me pas accessible sur les cartes graphiques desktop.

Max-Q peut compter sur trois piliers pour parvenir � ses fins : le dynamic boost 3.0 est l� pour r�partir au mieux la puissance �nerg�tique entre le CPU, le GPU et la m�moire vive, bien s�r, en fonction des besoins li�s aux t�ches en cours. Il va de paire avec le power gating qui g�re de mani�re aussi fine que possible fr�quence et tension des c�urs GPU. Enfin, le battery boost est sa troisi�me composante : l�objectif est ici d�ajuster au mieux la puissance disponible afin de pr�server la batterie tout en offrant de (encore) bonnes performances.

Toutes ces fonctionnalit�s ont leur mot � dire dans l�architecture Blackwell, mais le point le plus important, celui que NVIDIA a le plus mis en avant durant ces pr�sentations est sans doute possible la sortie de DLSS 4. Comme ce fut le cas avec la g�n�ration RTX s�rie 40, les RTX s�rie 50 profitent donc de leur DLSS encore que cette quatri�me mouture pourra tourner � avec une moindre efficacit� � sur les RTX s�rie 40. C�est toujours �a de pris.

DLSS 4 : la r�volution multi-frame generation

Du temps des RTX s�rie 40, NVIDIA a fait �voluer DLSS par deux fois avec le frame generation (DLSS 3) puis le ray construction (DLSS 3.5), deux technologies que l�on peut qualifier de compl�mentaires. Avec DLSS 4, NVIDIA tourne les choses diff�remment et son approche d�bute par un postulat : si nous voulons qualit� d�image, fluidit� de l�animation et r�activit�, il faut souvent faire des compromis entre ce que NVIDIA appelle les trois piliers du jeu vid�o en temps r�el� Vous vous en doutez, DLSS 4 doit permettre de ne plus faire de compromis ou, en tout cas, le moins possible.

Les transformateurs remplacent le CNN

On ne va pas revenir sur les ann�es d��volution de DLSS. Aujourd�hui, NVIDIA introduit ce qu�il appelle les � transformateurs � (transformers) lesquels doivent bouleverser les technologies pr�c�dentes � base de r�seaux neuronaux convolutionnels ou CNN. NVIDIA explique sur les transformateurs utilisent des � m�canismes d�attention � qui doivent permettre de focaliser les ressources de calcul sur les parties les plus importantes des donn�es � traiter. L�id�e est alors de mieux g�rer les parties les plus complexes d�une sc�ne pour en g�rer tous les d�tails.

Plusieurs exemples ont �t� communiqu�s par NVIDIA afin de d�montrer toute l�efficacit� des transformateurs par rapport aux vieillissants CNN. Qu�il s�agisse de cette maison derri�re une cl�ture en grillage ou de ce sac � dos, les d�tails ressortent effectivement bien davantage pour un rendu plus pr�cis, et ce, que l�on parle de la technologie de ray construction ou de celle de super resolution. De plus, NVIDIA souligne qu�au-del� des d�tails, les transformateurs doivent aussi permettre une image plus agr�able, plus naturelle, m�me en mouvement.

Le multi-frame generation � la rescousse

Nous connaissions le frame generation qui venait intercaler une image enti�rement calcul�e par l�IA entre deux images rendues par le GPU. Avec les RTX s�rie 50 et DLSS 4, NVIDIA passe la seconde et nous propose le multi-frame generation qui, comme son nom l�indique sans trop d�ambigu�t�, vient d�multiplier les choses. L�IA ne se charge donc plus ici d�ins�rer une image, mais g�n�re trois images suppl�mentaires pour deux images effectivement rendues par le GPU. NVIDIA s�amuse � dire qu�au total 15 pixels sur 16 sont maintenant g�n�r�s par l�IA ce qui, bien s�r, conduit � une augmentation de l�efficacit� du rendu par un facteur 8. Rien que �a !

NVIDIA aimant d�cid�ment bien les chiffres, nous en avons plusieurs pour les amateurs : la multi-frame generation ne se contente pas de ces 15 pixels sur 16, elle le fait avec un mod�le de g�n�ration d�images par l�IA 40 % plus rapide et capable de bien davantage �conomiser la m�moire vid�o : on parle l� de 30 % d��conomie tout de m�me. Sur Cyberpunk 2077 � un de ses jeux favoris � NVIDIA boit du petit lait : on passe de 27 ips avec 70 ms sans DLSS, � 70 ips/35 ms en DLSS, 140 ips/35 ms en DLSS 3.5 et carr�ment 248 ips en DLSS 4 tout en gardant une latence autour des 34 ms. Mieux, la qualit� d�image serait am�lior�e� toujours selon NVIDIA bien s�r.

De fait, NVIDIA peut parler de performances jusqu�� 8 fois sup�rieures gr�ce au multi-frame generation de DLSS 4 tout en offrant un meilleur rendu visuel. Bien s�r, si Cyberpunk 2077 est l�exemple favori de NVIDIA, la firme au cam�l�on a donn� d�autres exemples parmi les jeux les plus r�cents : Alan Wake 2, Black Myth: Wukong, Frostpunk 2, Hitman World of Assassination, Hogwarts Legacy. � chaque fois, les performances s�envolent m�me si le facteur 8 n�est plus toujours de mise, on reste � dans le pire des cas (Hitman World of Assassination) � un facteur de 4,7.

Reste maintenant la question de l�adoption de la technologie. Un point sur lequel NVIDIA s�est voulu rassurant en �voquant � 75 jeux et applications � compatibles DLSS 4 d�s la sortie et, bien s�r, une adoption qui devrait s�acc�l�rer tr�s rapidement. De plus, NVIDIA explique que la compatibilit� avec DLSS 3/DLSS 3.5 est assur�e afin que le travail d�int�gration soit plus simple pour les d�veloppeurs et il est aussi int�ressant de noter DLSS 4 n�est pas strictement r�serv� aux RTX s�rie 50.

Entendons-nous, le multi-frame generation demandera un GPU RTX s�rie 50. L�, il n�y a pas � tortiller et NVIDIA l�explique par le besoin des c�urs Tensor de 5e g�n�ration par exemple. En revanche, les am�liorations dans la qualit� de la g�n�ration d�images sera elle accessible � d�autres GPU. Oh, pas n�importe lesquels vous vous en doutez : seuls les GeForce RTX s�rie 40 pourront en profiter, mais �a reste un point int�ressant qui devrait, l� encore, favoriser l�adoption de la technologie.

Reflex 2 : lutter contre la latence, toujours

Souvenez-vous, au moment d�annoncer DLSS 3 et son frame generation, NVIDIA avait indiqu� que sa Reflex �tait indispensable pour �viter une augmentation trop nette de la latence syst�me : de part son fonctionnement m�me � il doit attendre le rendu de l�image suivante pour g�n�rer son image � DLSS 3 entra�ne une augmentation de la latence. Reflex faisait plut�t bien le boulot pour justement contrer ce d�faut, mais vous vous en doutez, le probl�me est plus crucial encore avec DLSS 4 puisqu�on parle de g�n�rer trois images toutes les deux rendues par le GPU.

Le lancement de DLSS 4 s�accompagne donc de celui de Reflex 2 qui, une fois encore il s�agit d�un chiffre officiel NVIDIA, permet une am�lioration de la latence de 75 % par rapport � Reflex. Comment ? Gr�ce � une technologie que NVIDIA baptis� frame warp et qui doit permettre une synchronisation encore plus efficace entre le CPU et le GPU. L�id�e est alors de surveiller les impulsions envoy�es par l�utilisateur afin de mettre � jour � en temps r�el � la position de la cam�ra par rapport � ces impulsions.

Accrochez-vous bien, NVIDIA explique que sa technologie prend en compte ses impulsions et transforme l�int�gration de l�image � c�est le inpainting de la capture ci-dessus � afin d�ajuster les choses en fonction de la position du curseur de la souris par exemple. Ensuite seulement, l�image ainsi modifi�e est envoy�e � l��cran pour �tre affich�e ! Pour �tre tout � fait honn�te, les explications donn�es par NVIDIA n�ont pas toutes �t� parfaitement claires � ce niveau, mais le r�sultat semble devoir �tre au rendez-vous. � v�rifier bien s�r.

Partagez :

Marques : GIGABYTE NVIDIA