
Si vous gérez des tâches liées à l'IA, vous savez déjà dans quelle mesure votre choix en matière de matériel détermine ce qui est possible et quel en est le coût. C'est pourquoi nous avons ajouté la NVIDIA RTX 5090 à Compute. Plus de rapidité, moins d'attente et un juste prix. Passons directement aux chiffres.
Lorsque nous l'avons lancé avec les 4090, cela a résolu un gros problème : les GPU pour centres de données tels que l'A100 étaient soit impossibles à obtenir, soit très chers. Le 4090 s'est avéré être le point idéal pour la plupart des charges de travail d'inférence LLM et d'IA.
Mais nos utilisateurs nous ont poussés plus loin. Les équipes souhaitaient une inférence plus rapide, une meilleure mise à l'échelle et une option permettant de passer à « tout » sans consommer d'énergie. Lorsque le premier lot de 5090 est arrivé, nous l'avons testé et avons ouvert une toute nouvelle région (UAE-2) afin que vous puissiez y accéder immédiatement.
Nous avons effectué des tests côte à côte en utilisant de véritables charges de travail LLM. Voici ce qui se démarque :

Si vous gérez des LLM de petite ou moyenne taille, le 5090 est désormais l'option la plus rapide et la plus rentable en matière de calcul.
Nous ne nous cachons pas derrière des repères que personne ne peut reproduire. Voici notre configuration :
Vous pouvez consulter les résultats détaillés dans notre PDF de référence. Si vous souhaitez examiner de plus près les configurations de test ou si vous souhaitez effectuer vos propres comparaisons, il vous suffit de demander. Nous sommes heureux de vous expliquer les détails.
Avec les 5090, toute personne utilisant des LLM dont les paramètres ne dépassent pas 13 milliards de paramètres peut bénéficier des performances de son centre de données, sans avoir à payer de facture ni à attendre six mois. Les cartes sont mises à l'échelle linéaire, ce qui vous permet de les regrouper et de gérer de lourdes charges de travail, ou d'en créer une pour des expériences rapides.
Tous les travaux n'ont pas besoin du plus gros marteau. Voici quand le 4090 ou l'A100 pourrait être votre meilleur choix :
Néanmoins, nous pensons que dans la plupart des cas d'utilisation, les 4090, et maintenant les 5090, constituent un meilleur choix que les A100. Consultez notre article précédent Pourquoi de plus en plus de développeurs choisissent le RTX 4090 au lieu de l'A100 pour en savoir plus.
C'est toujours aussi simple :

Vous êtes opérationnel en moins d'une minute.
Nous prévoyons déjà d'autres régions avec une capacité de 5090 et testons des modèles multi-GPU. Si vous avez des commentaires ou si vous souhaitez une fonctionnalité, faites-le nous savoir. L'informatique évolue en permanence avec vous.