GPUs em nuvem
TTFT de 5,4 ms. 9x mais rápido que um 4090 sob carga de pico. Arquitetura Blackwell. Cobrança por segundo. Sem taxas de saída.


TTFT: 45,4 ms (linha de base de solicitação única) — 84% mais rápido do que um A100 de 80 GB com carga equivalente.
Taxa de transferência de GPU dupla: 7.604 tokens/s — 2x a saída de um A100.
Especificação
Valor
Por que isso importa
Arquitetura
Blackwell
Processo 4NP — eficiente sob carga sustentada
Memória
32 GB GDDR7
Suficiente para fragmentos Llama-3 400B em uma única placa
Largura de banda
1,79 Tb/s
77% a mais do que o RTX 4090 — reduz os gargalos em cargas de trabalho de grandes lotes
Taxa de transferência do FP16
0,42 PFLOPS
~ 2,5 × os 165 TFLOPS da década de 4090 — espaço livre para difusão de alta resolução em grande escala
Interface PCIe
Geração 5 × 16
2x a largura de banda do PCIe 4 — elimina o gargalo da alimentação de dados
TDP
475 W
Mais tokens por watt do que o H100 80 GB
7.604 tokens/s em uma configuração de GPU dupla. Atenda chatbots em alta velocidade sem fazer concessões em lote.
Largura de banda de memória de 1,79 TB/s. Processamento de quadros 4K sem interrupções de E/S.
O PCIe Gen 5 × 16 elimina o gargalo de alimentação de dados durante tubulações RL-HF de várias etapas.
Gerencie montagens de leitura longa em uma única placa, sem a necessidade de dividir a carga de trabalho.
1 × - 8 ×
VRAM 32 - 256 GB
RAM 73 - 584 GB
CPU 8 - 64
Espaço em disco 250 - 2000 GB
Largura de banda 1000 Mb/s
Cobrança por segundo. Sem taxas de saída. Armazenamento incluído.
Entre em contato conosco em support@hivenet.com ou por meio do bate-papo no aplicativo.