Amazon Elastic Compute Cloud (EC2) : un nouveau service AWS qui permet aux clients de louer des GPU NVIDIA pour des projets d'IA rapides, et d'accéder à des instances de GPU NVIDIA H100 Tensor Core

De plus en plus d'entreprises utilisent de grands modèles de langage, qui nécessitent l'accès à des GPU. Les plus populaires d'entre eux sont de loin ceux de NVIDIA, ce qui les rend coûteux et souvent peu disponibles. Louer une instance à long terme auprès d'un fournisseur de services cloud alors que vous n'avez besoin d'accéder à ces ressources coûteuses que pour une seule tâche n'est pas forcément judicieux. Pour résoudre ce problème, AWS a lancé aujourd'hui Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML, qui permet aux clients d'acheter l'accès à ces GPU pour une durée définie, généralement pour exécuter une tâche liée à l'IA telle que l'entraînement d'un modèle d'apprentissage automatique ou l'exécution d'une expérience avec un modèle existant.

Le produit permet aux clients d'accéder à des instances de GPU NVIDIA H100 Tensor Core dans des clusters d'une à 64 instances avec 8 GPU par instance. Ils peuvent réserver du temps jusqu'à 14 jours par incréments d'un jour, jusqu'à 8 semaines à l'avance. Une fois le délai écoulé, les instances s'arrêtent automatiquement. Le nouveau produit permet aux utilisateurs de s'inscrire pour le nombre d'instances dont ils ont besoin pour un bloc de temps défini, tout comme la réservation d'une chambre d'hôtel pour un certain nombre de jours (selon les termes de l'entreprise). Du point de vue du client, il saura exactement combien de temps durera la tâche, combien de GPU il utilisera et combien cela lui coûtera à l'avance, ce qui lui donne une certitude en matière de coûts. Lorsqu'un utilisateur s'inscrit au service, celui-ci affiche le coût total pour la durée et les ressources. Les utilisateurs peuvent augmenter ou diminuer ce coût, en fonction de leur appétit pour les ressources et de leur budget, avant d'accepter d'acheter. Cette nouvelle fonctionnalité est généralement disponible à partir d'aujourd'hui dans la région AWS US East (Ohio).

Nom : Amazon EC2.png
Affichages : 1141
Taille : 27,6 Ko

Source : Amazon AWS a lancé Elastic Compute Cloud (EC2)

Et vous ?

Que pensez-vous du nouveau service Amazon EC2, le trouvez-vous intéressant ?

Voir aussi

AWS annonce un "cloud souverain" pour soutenir la résidence des données en Europe, une filiale d'Amazon promet un "cloud indépendant pour l'Europe"

Amazon Web Services acquiert Fig, une petite entreprise de San Francisco qui aide les développeurs à être plus efficaces et à collaborer tout en utilisant la ligne de commande

L'empire IPv4 d'AWS vaut désormais 4,5 milliards de dollars, AWS a augmenté son parc IPv4 de 27 millions d'adresses IP supplémentaires et possède désormais 128 millions d'adresses IPv4