Sep 20
2
NVidia Ampere: attention à la hype, il est urgent d’attendre et voici pourquoi
NVidia Ampere: attention à la hype, il est urgent d’attendre et voici pourquoi
Nous y voila, Ampere débarque en force avec la série des Geforce RTX 30. Comme à son habitude, Le CEO de NVidia a assuré une présentation impeccable avec un discours bien lissé. Les mots sont choisis avec soin, la gestuelle est nickel, et la mise en scène est encore plus réussie puisque, COVID oblige, la présentation a été enregistrée et montée au préalable.
Si vous n’avez pas vu la présentation, la voici:
Alors qu’est ce que l’on retient? Et bien on retient essentiellement une chose de tout cela, c’est que la Série Geforce RTX 30 nous est présentée comme étant globalement 2 fois plus performante que Turing, pour un tarif qui semble intéressant.
Oui mais… On connait la marque, on connait la musique avec des graphiques toujours très avantageux lors des présentations et il faut les interpréter.
Une chose semble assez dingue, il s’agit des caractéristiques techniques. Les voici telles qu’annoncées sur le site officiel de NVidia:
Sachant qu’une RTX 2080 Ti dispose de 4352 Cores (Shading Units), ces chiffres ressemblent à un lapin que Jensen aurait sorti de sa veste en cuir. C’est de la folie!
C’est d’autant plus dingue que cela correspond exactement au double des specs auxquelles on s’attendait, de par les différentes rumeurs et leaks. Mais alors, on va donc avoir droit à des cartes deux fois plus performantes, pour un prix similaire?
En réalité ce n’est pas si limpide. En regardant attentivement la présentation, on remarque ceci à 17:28
« Ampere does 2 shader calculations per clock »
Oui mais qu’est ce que cela signifie? Cela va doubler les performances? Et bien c’est là que la bas blesse, on n’en sait rien pour l’instant, en l’absence de vrai benchmark. Alors on nous promet un bond en avant totalement fulgurant sur le RT et le DLSS, tout cela est très intéressant, mais ce n’est pas forcément une raison pour s’enthousiasmer: depuis la sortie de Turing il y a 2 ans, seuls 13 jeux supportent officiellement le ray tracing, pour le dire plus simplement 99% des jeux ne le supportent pas. En fait, il y a bien plus de jeux supportant SLI que de jeux supportant le RT… Mais bien sur tous les tableaux nous montrent des gains en perfs sur cette sélection de jeux représentant moins de 1% des jeux disponibles:
On se souvient des tableaux très flatteurs présentés pour Turing:
Une 2080 Ti présentée comme 10 fois plus performante que la 1080 Ti… En fin de compte, cela concernait uniquement le RT, pour la rastérisation on avait un gain de 15 à 20% mais ça NVidia ne l’a jamais mis en avant.
Nous avons ici une nouvelle architecture, de nouvelles technologies, un PCB plus petit avec des composants hyper concentrés, un process de gravure différent, une solution de refroidissement améliorée, et on nous annonce là encore des performances de folie. Ou est l’embrouille?
Et bien l’embrouille, on la trouve dans la mise en avant des caractéristiques avec un nombre de cuda cores annoncé qui semble correspondre au double du nombre réel.
On le voit ici par exemple sur les RTX 3000 ASUS:
Un souci? Un début d’explication:
Je cite le message, qui est assez clair:
« Hello, alors en fait non c’est bien juste. Les customs 3090 affichent 5248 cœurs CUDA tandis que la FE affiche 10496, soit exactement deux fois plus. Simplement parce que Nvidia considère qu’un cœur est deux fois plus efficace que sur la génération précédente et du coup ils l’affichent comme ça. »
On a donc des specs affichées qui ne correspondent pas vraiment à la réalité, en fait les specs semblent avoir été modifiées en dernière minute, probablement pour un meilleur impact marketing.
Steve de GN l’a relevé ici à 4:18
Il s’est contenté d’un message d’avertissement:
« The CUDA core definition has not changed, but the scenarios where you can utilize 100% of CUDA cores are sometimes limited (as the SM has been reworked to do FP+FP, FP+INT, etc; rather than FP *or* INT) »
Moore’s Law Is Dead a remarqué la même chose, ici à 6:40
Dans des communiqués de presse, Asus a annoncé des specs avec la moitié des cuda cores annoncés lors de la présentation par NVidia… Et Asus a rectifié depuis. Donc en gros, ils avaient préparé des documents avec les vraies specs des cartes, NVidia a décidé sur le tard d’annoncer des cuda cores 2 fois plus élevés (ils le justifient manifestement par le fonctionnement différent sur Ampere) mais c’était trop tard, ils avaient déja mis certains documents en ligne… Ils ont donc du éditer dans l’urgence pour coller au discours de NVidia.
La problématique de cette présentation qui semble éxagérer le bond de performances entre Turing et Ampere est bien détaillée ici: Nvidia’s presentation was fairly shocking.
On se souvient de ce bench qui avait leaké:
Si la carte du bench est une 3090, alors c’est un gain de 40% en performances par rapport à une 2080 Ti FE. C’est un progrès très significatif, c’est plus plausible que des perfs doublées. Mais qu’en est il vraiment?
Avec cette manie de jouer avec les chiffres et d’utiliser des graphiques trop flatteurs, NVidia sème le doute.
Aujourd’hui, au lendemain de la présentation, les informations données par la marque ont été reprises telles quelles partout sur le net: sur tous les sites d’informatique, par tous les youtubers… C’est l’hystérie. Il n’y a qu’une poignée de sceptiques qui essayent de calmer le jeu. Ne vous enflammez pas, car toute cette hype pourrait retomber bientôt.
Sans jouer les rabat-joie, les performances doublées risquent de ne concerner qu’une poignée de jeux, et le gain de perfs en rastérisation pure pourrait être moins élevé que prévu… Les chiffres communiqués par NVidia induisent en erreur. Il faut faire attention, et il ne faudra se fier qu’à de véritables tests et benchmarks indépendants. Avec la présentation d’Ampere, il na jamais été autant urgent d’attendre.
A lire également
Continuez votre lecture sur des sujets similaires en consultant les articles suivants :

Publier un commentaire