
Se você está executando trabalhos de IA, já sabe o quanto sua escolha de hardware molda o que é possível e quanto custa. É por isso que adicionamos a NVIDIA RTX 5090 ao Compute. Mais velocidade, menos espera e um preço justo. Vamos direto aos números.
Quando lançamos na década de 4090, isso resolveu um grande problema: GPUs de data center como a A100 eram impossíveis de obter ou eram muito caras. O 4090 acabou sendo o ponto ideal para a maioria das cargas de trabalho de inferência e IA do LLM.
Mas nossos usuários nos impulsionaram ainda mais. As equipes queriam uma inferência mais rápida, melhor escalabilidade e a opção de “apostar tudo” sem gastar energia. Quando o primeiro lote de 5090s chegou, nós os testamos e abrimos uma região totalmente nova (Emirados Árabes Unidos 2) para que você pudesse ter acesso imediatamente.
Executamos testes lado a lado usando cargas de trabalho reais do LLM. Veja o que se destaca:

Se você estiver executando LLMs de pequeno a médio porte, o 5090 agora é a opção mais rápida e econômica em computação.
Não nos escondemos atrás de benchmarks que ninguém consegue reproduzir. Aqui está nossa configuração:
Você pode conferir os resultados detalhados em nosso PDF de referência. Se você quiser ver mais de perto as configurações de teste ou executar suas próprias comparações, basta perguntar. Teremos prazer em orientar você nos detalhes.
Com o 5090s, qualquer pessoa que execute LLMs de até 13 bilhões de parâmetros pode obter o desempenho do data center, sem uma conta do data center ou uma lista de espera de seis meses. Os cartões são dimensionados linearmente, para que você possa agrupá-los e lidar com cargas de trabalho pesadas ou criar um para experimentos rápidos.
Nem todo trabalho precisa do maior martelo. É aqui que o 4090 ou o A100 podem ser sua melhor escolha:
Ainda assim, achamos que, para a maioria dos casos de uso, os anos 4090 e agora 5090 são uma escolha melhor do que os A100s. Confira nossa postagem anterior Por que mais desenvolvedores estão escolhendo o RTX 4090 em vez do A100 para mais.
Está mais simples do que nunca:

Você estará pronto e funcionando em menos de um minuto.
Já estamos planejando mais regiões com capacidade de 5090 e estamos testando modelos de várias GPUs. Se você tiver feedback ou quiser um recurso, entre em contato conosco. A computação está sempre evoluindo com você.