Ansys Fluent em GPUs: capacitação e limites

O solucionador de GPU nativo da Fluent pode acelerar muitos casos baseados em pressão. Ele ainda não abrange todos os modelos físicos ou malhas, e a VRAM é importante. Este guia mostra como executar o Fluent em um serviço de computação como o Compute sem adivinhações, como confirmar se o caminho da GPU está ativo e o que verificar antes de escalar.

O que isso cobre

Escolhendo um Modelo pronto para CUDA
Conectando seu licença (FLEXnet) com segurança
Começando fluentemente em lote com um arquivo de diário (recomendado) ou usando a GUI
Ativando o solucionador de GPU e verificando se está realmente em uso
Um pequeno validação + autoavaliação protocolo que você pode copiar
Limites, dicas de VRAM e solução de problemas

O Fluent evolui rapidamente. Trate esta página como uma lista de verificação prática. Sempre confirme a cobertura do modelo em relação às notas de lançamento da versão instalada.

1) Escolha um modelo pronto para CUDA

Normalmente, seu trabalho é executado dentro de uma imagem de contêiner que você escolhe.

Início rápido: use um modelo CUDA geral, como Ubuntu 24.04 LTS (CUDA 12.6).
Sua própria imagem: se seu laboratório tiver uma base pronta para o Fluent, aponte o modelo para essa imagem.

Você faz não precisa do Docker‑in‑Docker. O driver do host geralmente é fornecido pelo seu provedor de computação.

2) Transfira sua licença (FLEXnet)

Defina a variável de ambiente correta no seu modelo Ambiente → Variáveis e conecte-se VPN ou um Túnel SSH (consulte o guia de licenciamento).

# Exemplo (portas são exemplos; use seus valores fixados) ANSYSLMD_LICENSE_FILE= 1055@licenses.my-org.edu

Se estiver cavando um túnel, aponte para 1055 @localhost e mantenha a porta do fornecedor que você encaminhou.

3) Instale ou monte o Fluent

Seja fluente você mesmo — a HiveNet não a distribui.

Instalador dentro do modelo: monte seu arquivo de instalação e execute o instalador Linux no contêiner. Mantenha a imagem privada.
Volume compartilhado: se sua organização fornecer um compartilhamento de rede com o Fluent, monte-o somente para leitura na instância.

Mantenha as licenças e os instaladores longe das imagens públicas. Monte-os em tempo de execução.

4) Start Fluent (lote recomendado)

As execuções em lote são reproduzíveis e fáceis de automatizar. Prepare um diário (run.jou) e um correspondente caso/dados (.dinheiro.5/.dat.h5). Inicie o Fluent a partir do invólucro do contêiner:

# 3D, sem cabeça, escreva um diário 3d -g -i run.jou fluente

3d ou 2d de acordo com seu modelo.
-g não tem cabeça (sem GUI).
- Eu corro. executa seu diário.

Prefere a GUI? Lançamento 3d fluente (não -g) dentro do contêiner e use seu fluxo de trabalho de desktop remoto. Para malhas pesadas, o lote ainda é melhor.

5) Ative o solucionador de GPU

Use a opção documentada da sua versão Fluent para ativar aceleração de GPU. Em versões recentes, há uma caixa de seleção em Geral → Aceleração de GPU e um comando TUI correspondente. Mantenha as coisas simples na primeira execução:

GPU única
Precisão única (padrão para o caminho da GPU)
Solucionador baseado em pressão

Confirme se está ativo: no console/log do Fluent, você deve ver mensagens informando que um dispositivo de GPU foi inicializado e que os kernels do solucionador foram descarregados. Se os registros mostrarem caminhos somente da CPU, o recurso ou modelo selecionado talvez ainda não esteja coberto pela GPU.

6) Valide antes de escalar

Numéricos

Comece com uma precisão simples, se seu caso permitir; compare com uma pequena CPU de dupla precisão linha de base para algumas iterações/etapas de tempo.
Verifique a correspondência de resíduos, forças/coeficientes e uma métrica específica do domínio (por exemplo, queda de pressão) dentro de suas faixas de aceitação.

VRAM e malha

Relógio nvidia-smi para uso de memória.
Se você clicar em OOM, torne a malha mais grossa (dentro das regras de validação), reduza as saídas ou experimente uma GPU com mais VRAM.

Autoavaliação

Mesmo caso, mesmos critérios de parada, mesma física.
Registre o relógio de parede, as iterações/segundo e o custo por caso convergente.

Matemática de custos

custo_por_converged_case = preço_por_hora × horas_parede

7) Limites comuns (planeje em torno deles)

Cobertura de física está se expandindo, mas não é universal. Verifique suas notas de lançamento para combustão, multifase, acústica, radiação, etc.
Precisão dupla: o caminho da GPU favorece a precisão única. Se seu gabinete precisar ser executado em FP64, espere ganhos menores ou permaneça na CPU.
Várias GPUs existe em alguns casos, mas comece com GPU única para validar números e memória e, em seguida, escalar.
I/O pode dominar. Reduza a frequência de gravação, compacte registros e armazene dados no NVMe local.

8) Esqueleto mínimo do diário (adapte-se ao seu modelo)

Este é um padronizar, não um arquivo suspenso — substitua-o pelos comandos certos para sua física e sua versão.

/file/read-case-data case.cas.h5 ; Ative a aceleração de GPU via TUI para sua versão ; (Use o comando documentado ou alterne em Geral → Aceleração de GPU) /solve/inicialize/inicialize-flow /solve/iterate 1000 /file/write-case-data out.cas.h5 /exit sim

Mantenha uma nota sobre métodos com: versão fluente, nome do caso, modelos físicos, sinalizador habilitado para GPU e critérios de interrupção.

9) Solução de problemas

“Dispositivo de GPU não encontrado/não inicializado”
Confirme nvidia-smi funciona dentro do contêiner. O modelo deve ter espaço de usuário CUDA e o host deve passar pelo driver (a computação faz isso). Se você usar sua própria imagem, combine CUDA com seu driver sempre que possível.

“Recurso não disponível no modo GPU”
Desligue o modelo não suportado ou execute o caso na CPU para esse estudo.

Sem memória (OOM)
Reduza o tamanho da malha ou as saídas; ou selecione um perfil com VRAM maior.

Erros de licença
Verifique seu ANSYSLMD_LICENSE_FILE e seu túnel VPN/SSH. Veja o guia de licenciamento.

Mais lento que a CPU
Nem todos os casos se beneficiam. Primeiro, crie um perfil com uma caixa pequena; considere a CPU se a física/malha não for bem mapeada para o caminho da GPU.

Trecho de métodos (copiar e colar)

hardware: gpu: "<model>(<VRAM>GB)” motorista: "<NVIDIA driver version>” <CUDA version>cuda: "” CPU: “<model/cores>” software: fluente: "<version>(solucionador de GPU ativado)” os_image: “Ubuntu 24.04 LTS (CUDA 12.6)” licenças: responde: “ANSYSLMD_LICENSE_FILE= 1055@licenses.my-org.edu” executar: modo: “lote” diário: “run.jou” notas: “baseado em pressão, precisão única, GPU única” saídas: <hh:mm>horas_de_parede: "” <value>iter_por_seg: "” <residuals/metric>critérios_convergentes: “”

Leitura relacionada

Modelagem científica em GPUs em nuvem — o que funciona e o que não funciona

Experimente o Compute hoje

Inicie uma instância de GPU com um modelo pronto para CUDA (por exemplo, Ubuntu 24.04 LTS/CUDA 12.6) ou sua própria imagem GROMACS. Aproveite o faturamento flexível por segundo com modelos personalizados e a capacidade de iniciar, interromper e retomar suas sessões a qualquer momento. Não tem certeza sobre os requisitos do FP64? Entre em contato com o suporte para ajudá-lo a selecionar o perfil de hardware ideal para suas necessidades computacionais.

‍

Quando os estudantes de IA superam a sandbox: como a DSTI expandiu seu acesso à GPU com a Hivenet

A DSTI School of Engineering fez parceria com a Hivenet para oferecer aos alunos de mestrado um acesso mais consistente à computação de GPU europeia acessível para projetos reais de aprendizado profundo.