GPUs em nuvem

GPUs em nuvem NVIDIA RTX 4090. A partir de 0,20€ por hora. Na França, Emirados Árabes Unidos e EUA.

Desempenho do A100 pelo preço de um 4090. Cobrança por segundo. Sem filas. Sem taxas de saída.

Desempenho do A100 pelo preço de um 4090

Referência de GPU única na infraestrutura Hivenet:

TTFT: 349,9 ms a 1 req/s (linha de base de solicitação única).

Pico de produtividade: 737 tokens/senquanto entrega 737 tokens/s sob carga sustentada.¹

¹ Metodologia de referência e condições de teste aqui.

Especificações do RTX 4090

Especificação

Valor

Por que isso importa

Arquitetura

Ada Lovelace

Processo de 4 nm — eficiente sob carga pesada sustentada

Memória

24 GB GDDR6X

Compatível com Llama-3 70B (quantização de 4 bits) em uma única placa

Largura de banda

1.008 Gb/s

Evita paralisações do tensor na inferência de grandes lotes

Taxa de transferência do FP16

165 FRACASSOS

Espaço livre para modelos de difusão em 1024 × 1024

TDP

450 W

Menor que um A100 de 40 GB com taxa de transferência de inferência equivalente

Deslize para a esquerda para ver mais

Lance um 4090 agora →

Casos de uso populares

Ajuste modelos de grandes linguagens

Inicie uma execução do QLoRa em menos de 60 segundos. Faça uma pausa e retome a qualquer momento, sem cobrança pelo tempo ocioso.

Treine modelos de difusão e vídeo

A VRAM de 24 GB suporta cache de 14 GB KV com precisão total. Nenhuma quantização é necessária para a maioria dos modelos de difusão em 1024 × 1024.

Execute chatbots privados

A inferência permanece em sua conta. Sem registros de API de terceiros.

Vídeo de formato longo sofisticado

A largura de banda de memória de 1.008 GB/s suporta quadros de 4K sem interrupções de E/S.

Pronto para o lançamento?

vCPU

0,035 - 0,56 /h

2 × - 32 ×

RAM 4 - 64 GB

Espaço em disco 50 - 800 GB

Largura de banda 250 - 1000 Mb/s

Cobrança por segundo. Sem taxas de saída. Armazenamento incluído.

Perguntas?

Entre em contato conosco em support@hivenet.com ou por meio do bate-papo no aplicativo.