Le supercalculateur NVIDIA DGX A100 a fourni aux organisations et aux institutions de recherche une nouvelle capacité, et à mesure que ces projets se sont développés, le nombre de petits clusters de NVIDIA DGX a augmenté. Ceci générant à son tour une demande encore plus importante en termes de système de stockage.
Alors que de nombreux fournisseurs de stockage se sont empressés de développer des solutions pour les super-pods de plusieurs pétaoctets, PNY s’est concentré sur une solution pour le client moyen. En collaboration avec une équipe de stockage dédiée pour chaque logiciel, PNY a mis au point une solution sur mesure axée uniquement sur les caractéristiques clés de NVIDIA, telles que HDR/200Gbe et GPUDirect, à partir de 30 To. Les solutions sont conçues pour être abordables pour les nouveaux projets, tout en offrant des performances HDR/200Gbe complètes. Le modèle 1U est extensible jusqu’à 150 To et le modèle 2U jusqu’à 360 To, avec des boîtiers d’extension 1U / 2U en option si les projets évoluent.
Le modèle 1U a été conçu pour le marché en pleine croissance des POD / Edge, où un stockage ultra-rapide est nécessaire pour l’inférence, mais où le coût et l’espace sont critiques.
« Les fonds du projet sont mieux dépensés pour les GPU, ce sont ces derniers qui fournissent la valeur pour l’utilisateur et le retour sur investissement. Cependant, nous devons nous assurer que le stockage peut maintenir les GPU actifs et offrir la qualité nécessaire pour soutenir des niveaux de performance aussi élevés. Notre solution de génération 1 offrait cela, mais avec la connectivité NVMe-oF, elle était surtout limitée à des serveurs uniques. Au fur et à mesure que les projets se développaient, même s’il ne s’agissait que de deux serveurs, ils avaient besoin de plus de puissance de stockage et de pouvoir partager les données. C’était le défi à relever et cela a demandé beaucoup d’attention, d’investissement et de temps, mais nous en sommes convaincus, les résultats changeront l’aspect d’une solution A.I. POD par défaut. Si vous lancez un projet d’I.A. et que vous devez prendre en compte le stockage tout en vous assurant que vos fonds sont principalement dépensés dans le GPU, ceci fournit un équipement simple et prêt à l’emploi », a déclaré Laurent Chapoulaud, directeur marketing des solutions professionnelles pour PNY EMEAI.
La solution est actuellement unique à PNY et, bien que son objectif premier soit le prix, les performances et la facilité d’utilisation, des fonctions supplémentaires sont en cours de développement pour aider à unifier le PNY POD complet (par exemple, la surveillance complète de NVIDIA) et faire face aux défis croissants auxquels sont confrontées les solutions isolées et basées sur la périphérie ; non seulement le stockage PNY se surveillera lui-même, mais il surveillera également le NVIDIA DGX et le commutateur Mellanox, créant un chemin de support unifié unique pour les partenaires de solution afin de fournir une surveillance à distance complète.
« PNY vise à fournir à ses partenaires tous les éléments nécessaires pour créer une solution complète, l’ajout d’options de surveillance à distance unifiée du PNY POD n’est qu’une extension de l’engagement de PNY à aider les revendeurs à fournir des solutions ».
Pour aider à mettre au point la solution, PNY a travaillé avec Mark Klarzynski, un expert en stockage de longue date et un pionnier du mouvement Software Defined Storage et du concept All Flash Array. « Il est clair que l’accent mis sur les performances a porté ses fruits. Dans nos tests, même une solution 1U d’entrée de gamme a surpassé une baie All Flash de classe entreprise. Dans le domaine du stockage, nous disposons de nombreuses méthodes de test pour obtenir d’excellents résultats de référence, et nous utilisons généralement plusieurs serveurs pour accélérer le stockage et obtenir des chiffres de performance attrayants et commercialisables. Cependant, avec les solutions PNY, un seul serveur NVIDIA A100 pouvait facilement saturer la liaison HDR/200Gbe. En d’autres termes, il a surpassé la plupart des principaux fournisseurs à une fraction du coût, sans même faire d’efforts », a commenté Mark Klarzynski.
« En exécutant des tests réels d’apprentissage profond, nous n’avions tout simplement pas assez de matériel, nous avions trois serveurs DGX au maximum de leurs capacités et le stockage semblait à peine essayer. La nouvelle conception a fait bon usage des forces de NVIDIA Mellanox RDMA, en construisant une nouvelle pile de stockage pour tirer pleinement parti de sa latence ultra-faible et de sa bande passante élevée. Mais, en fin de compte, j’ai été le plus impressionné par sa facilité d’utilisation, nous l’avons simplement branché et en quelques minutes nous étions opérationnels », a ajouté Mark Klarzynski.