Tout d’abord, le D52G-4U supporte huit accélérateurs de calcul GPU NVIDIA Tesla V100 SXM2, dotés d’une capacité d’interconnexion GPU vers GPU maximale de 300 GB/s grâce à la technologie NVLink™ ; il assure ainsi une excellente performance d’entraînement, permettant de raccourcir le développement R&D tout en adoptant le Deep Learning pour des business models plus innovants.
Le D52G-4U dépasse les réseaux de neurones convolutifs les plus prisés tels qu’Inception V3 et, en plus complexe, Resnet-50; il montre également une efficience de 96,2 % dans l’exécution de GoogleNet sur huit NVIDIA®Tesla V100. Avec une telle efficacité dans la mise à l’échelle, le D52G saura tirer une puissance de calcul optimale de multiples GPU afin d’accélérer les modèles d’entraînement.
Deuxièmement, la carte de base PCIe D52G-4U offre une topologie flexible sur huit GPU à double largeur afin d’optimiser soit la bande passante CPU vers GPU, soit la communication GPU vers GPU, ajustant ainsi la performance pour diverses applications Haute performance afin de réduire le risque des investissements en TIC. Enfin, après avoir entraîné un modèle avec un haut niveau de précision, la clé pour innover avec succès est de chercher comment livrer efficacement ce modèle pré-entraîné à un nombre maximal d’utilisateurs.
Avec ses vingt fentes uniques, la carte de base D52G-4U peut satisfaire de très fortes demandes en matière d’inférence, en même temps que des GPU énergétiquement efficaces à seize fentes uniques tels que le NVIDIA Tesla® P4. Ce SKU supporte également un réseau Infiniband avec bande passante élevée et latence réduite pour un accroissement horizontal des performances, ainsi que 24 baies de stockage SFF avec périphériques SSD NVMe de faible latence pour réduire la lecture E/S et fournir de vastes quantités de données à cette très puissante machine.
Le D52G-4U dépasse les réseaux de neurones convolutifs les plus prisés tels qu’Inception V3 et, en plus complexe, Resnet-50; il montre également une efficience de 96,2 % dans l’exécution de GoogleNet sur huit NVIDIA®Tesla V100. Avec une telle efficacité dans la mise à l’échelle, le D52G saura tirer une puissance de calcul optimale de multiples GPU afin d’accélérer les modèles d’entraînement.
Deuxièmement, la carte de base PCIe D52G-4U offre une topologie flexible sur huit GPU à double largeur afin d’optimiser soit la bande passante CPU vers GPU, soit la communication GPU vers GPU, ajustant ainsi la performance pour diverses applications Haute performance afin de réduire le risque des investissements en TIC. Enfin, après avoir entraîné un modèle avec un haut niveau de précision, la clé pour innover avec succès est de chercher comment livrer efficacement ce modèle pré-entraîné à un nombre maximal d’utilisateurs.
Avec ses vingt fentes uniques, la carte de base D52G-4U peut satisfaire de très fortes demandes en matière d’inférence, en même temps que des GPU énergétiquement efficaces à seize fentes uniques tels que le NVIDIA Tesla® P4. Ce SKU supporte également un réseau Infiniband avec bande passante élevée et latence réduite pour un accroissement horizontal des performances, ainsi que 24 baies de stockage SFF avec périphériques SSD NVMe de faible latence pour réduire la lecture E/S et fournir de vastes quantités de données à cette très puissante machine.
Autres articles
-
NVIDIA AI Foundry crée des modèles d'IA générative Llama 3.1 personnalisés pour les entreprises du monde entier
-
Mistral AI et NVIDIA dévoilent Mistral NeMo 12B, un modèle d'IA d'entreprise de pointe
-
Databricks et NVIDIA renforcent leur partenariat pour accélérer les données d'entreprise à l'ère de l'IA générative
-
Oracle et NVIDIA vont proposer une intelligence artificielle souveraine
-
Cloudera et NVIDIA collaborent pour développer des capacités d’IA générative avec NVIDIA Microservices