Les États-Unis recherchent des systèmes exascale 10 fois plus rapides que les ordinateurs de pointe actuels
La Chine prétend en avoir 10 en construction et pourrait prendre de l'avance dans la course aux armements HPC

Le pays du soleil levant est tombé sous la puissance du supercalculateur américain. Le nouveau supercalculateur Frontier du Laboratoire national d'Oak Ridge (ORNL) a évincé le japonais Fugaku à base de puces ARM, récupérant au passage la première place du classement Top500 des systèmes connus publiquement comme étant les plus puissants au monde.

Il faut souligner que l'avance de Frontier sur la machine japonaise Fujitsu, qui est basée sur l'A64X, n'est pas étroite : le cluster a atteint des performances maximales de 1,1 exaflops selon le benchmark Linpack (qui est la norme selon laquelle les supercalculateurs sont classés depuis le milieu des années 1990) contre 442 pétaflops de performance pour Fugaku (qui était une performance suffisamment solide pour maintenir Fugaku à la première place pendant deux ans).

Frontier est donc devenu le premier supercalculateur analysé publiquement à franchir l’exaflop.

« Avec un score HPL exact de 1,102 Exaflop/s, Frontier n'est pas seulement le supercalculateur le plus puissant qui ait jamais existé, c'est aussi la première véritable machine exascale », a déclaré l'annonce du Top500.

Pour mémoire, le milliard d’instructions par seconde (gigaflops) a été dépassé en 1985 ; les 1000 milliards (téraflops) en 1997 ; le million de milliards en 2008. En 2016, le cap du pétaflops a été franchi par plus d’une centaine de machines de par le monde. L’exascale (exaflops), soit la capacité à effectuer un milliard de milliards de calculs chaque seconde, a été franchie par Frontier.

Les États-Unis recherchent des systèmes exascale 10 fois plus rapides

Le département américain de l'énergie (DoE) recherche des fournisseurs qui aideront à construire des supercalculateurs jusqu'à 10 fois plus rapides que le système exascale Frontier récemment inauguré pour entrer en service entre 2025 et 2030, et des systèmes encore plus puissants que celui des années 2030.

Ces détails ont été divulgués dans une demande d'informations (RFI) émise par le DoE pour les fournisseurs de matériel informatique et de logiciels, les intégrateurs de systèmes et autres pour « aider les laboratoires nationaux (laboratoires) du DoE à planifier, concevoir, mettre en service et acquérir la prochaine génération de systèmes de calcul intensif à l'horizon 2025-2030 ».

Les commerçants ont jusqu'à fin juillet pour répondre.

Pour cette RFI, le DoE se dit intéressé par le déploiement d'un ou plusieurs supercalculateurs capables de résoudre des problèmes scientifiques cinq à 10 fois plus rapidement que les systèmes de pointe actuels « ou résoudre des problèmes plus complexes, comme ceux avec plus de la physique ou les exigences d'une plus grande fidélité ».

Le système exascale Frontier installé dans le laboratoire national d'Oak Ridge a été déclaré opérationnel fin mai et cadencé à 1.102 Linpack exaFLOPS de puissance de calcul, mais qui devrait atteindre un pic performances théoriques supérieures à 2 exaFLOPS à l'avenir.

Dans cette optique, le DoE déclare que son estimation approximative - basée sur les tendances couvrant les 20 dernières années - inclut les systèmes HPC traditionnels au niveau 10-20 exaFLOPS ou au-delà dans la période allant au-delà de 2025, et au moins 100 exaFLOPS dans la période allant au-delà de 2030, qu'il s'attend à livrer « grâce à des mécanismes d'accélération matérielle et logicielle ».

Tout supercalculateur de ce type devrait fonctionner dans une enveloppe de puissance de 20 à 60 MW, selon le DoE. À titre de comparaison, le système Frontier consomme déjà environ 20 MW et peut apparemment atteindre un pic de plus de 30 MW.

Les systèmes doivent également être « suffisamment résistants » aux pannes matérielles et logicielles pour minimiser les besoins d'intervention de l'utilisateur.

Fait intéressant, le DoE indique qu'il cherche à s'éloigner des « acquisitions monolithiques » pour se tourner vers un modèle qui permettrait des cycles de mise à niveau plus rapides des systèmes déployés pour permettre une innovation plus rapide sur le matériel et les logiciels.

Nom : us.png
Affichages : 5183
Taille : 62,9 Ko

Une stratégie possible qui pourrait être suivie est une réutilisation accrue de l'infrastructure existante afin que les mises à niveau soient modulaires, avec un processus d'acquisition qui permet l'injection continue d'avancées technologiques dans les installations, peut-être tous les 12 à 24 mois plutôt que sur une période de quatre ou cinq ans.

Cela ressemble quelque peu à l'approche qui a été adoptée pour le premier ordinateur exascale déclaré publiquement en Europe, le système Jupiter construit en Allemagne par l'entreprise commune européenne de calcul à haute performance (EuroHPC JU).

Jupiter sera basé sur une « architecture de supercalcul dynamique et modulaire », selon le Forschungszentrum Jülich où il sera basé, comprenant un module de cluster universel couplé à un module d'accélérateur GPU et des modules de stockage, mais il est prévu d'être étendu à l'avenir avec des modules supplémentaires qui peuvent comprendre une unité de traitement quantique ou un module de traitement neuromorphique.

Les réponses à cette demande d'informations aideront le DoE et les laboratoires nationaux à mettre à jour leurs feuilles de route informatiques avancées à long terme, ainsi qu'à informer les exigences d'un ou plusieurs appels d'offres d'acquisition de systèmes DoE (demande de propositions) pour les systèmes à livrer sur la période 2025 à 2030.

Le niveau d'informations demandé aux fournisseurs par le DoE est assez détaillé, couvrant non seulement le type de processeurs, de mémoire, de stockage et d'options d'interconnexion que les fournisseurs prévoient d'utiliser entre 2025 et 2030, mais aussi avec quels processus de fabrication ils s'attendent à ce que les puces soient fabriquées, si les processeurs seront une forme de combinaison système sur puce APU/XPU, les attentes en matière de bande passante et de puissance des interconnexions, la configuration potentielle des nœuds, etc.

Peut-être que la démarche du DoE a été stimulée par la crainte que les États-Unis ne prennent du retard sur la Chine dans la course aux armements de superinformatique, comme indiqué plus tôt cette année.

Alors que les États-Unis ont trois systèmes exascale en préparation, la Chine vise à avoir jusqu'à 10 systèmes opérationnels d'ici 2025, et des rapports du Financial Times ont affirmé que les experts américains craignaient que la Chine ne les batte sur les percées scientifiques et technologiques importantes en mettant en service un plus grand nombre de machines exascale.

Source : ministère américain de l'Énergie