← Blog
September 1, 2025

Ansys Fluent em GPUs: capacitação e limites

O solucionador de GPU nativo da Fluent pode acelerar muitos casos baseados em pressão. Ele ainda não abrange todos os modelos físicos ou malhas, e a VRAM é importante. Este guia mostra como executar o Fluent em um serviço de computação como o Compute sem adivinhações, como confirmar se o caminho da GPU está ativo e o que verificar antes de escalar.

O que isso cobre

  • Escolhendo um Modelo pronto para CUDA
  • Conectando seu licença (FLEXnet) com segurança
  • Começando fluentemente em lote com um arquivo de diário (recomendado) ou usando a GUI
  • Ativando o solucionador de GPU e verificando se está realmente em uso
  • Um pequeno validação + autoavaliação protocolo que você pode copiar
  • Limites, dicas de VRAM e solução de problemas

O Fluent evolui rapidamente. Trate esta página como uma lista de verificação prática. Sempre confirme a cobertura do modelo em relação às notas de lançamento da versão instalada.

1) Escolha um modelo pronto para CUDA

Normalmente, seu trabalho é executado dentro de uma imagem de contêiner que você escolhe.

  • Início rápido: use um modelo CUDA geral, como Ubuntu 24.04 LTS (CUDA 12.6).
  • Sua própria imagem: se seu laboratório tiver uma base pronta para o Fluent, aponte o modelo para essa imagem.

Você faz não precisa do Docker‑in‑Docker. O driver do host geralmente é fornecido pelo seu provedor de computação.

2) Transfira sua licença (FLEXnet)

Defina a variável de ambiente correta no seu modelo Ambiente → Variáveis e conecte-se VPN ou um Túnel SSH (consulte o guia de licenciamento).

# Exemplo (portas são exemplos; use seus valores fixados)
ANSYSLMD_LICENSE_FILE= 1055@licenses.my-org.edu

Se estiver cavando um túnel, aponte para 1055 @localhost e mantenha a porta do fornecedor que você encaminhou.

3) Instale ou monte o Fluent

Seja fluente você mesmo — a HiveNet não a distribui.

  • Instalador dentro do modelo: monte seu arquivo de instalação e execute o instalador Linux no contêiner. Mantenha a imagem privada.
  • Volume compartilhado: se sua organização fornecer um compartilhamento de rede com o Fluent, monte-o somente para leitura na instância.

Mantenha as licenças e os instaladores longe das imagens públicas. Monte-os em tempo de execução.

4) Start Fluent (lote recomendado)

As execuções em lote são reproduzíveis e fáceis de automatizar. Prepare um diário (run.jou) e um correspondente caso/dados (.dinheiro.5/.dat.h5). Inicie o Fluent a partir do invólucro do contêiner:

# 3D, sem cabeça, escreva um diário
3d -g -i run.jou fluente

  • 3d ou 2d de acordo com seu modelo.
  • -g não tem cabeça (sem GUI).
  • - Eu corro. executa seu diário.

Prefere a GUI? Lançamento 3d fluente (não -g) dentro do contêiner e use seu fluxo de trabalho de desktop remoto. Para malhas pesadas, o lote ainda é melhor.

5) Ative o solucionador de GPU

Use a opção documentada da sua versão Fluent para ativar aceleração de GPU. Em versões recentes, há uma caixa de seleção em Geral → Aceleração de GPU e um comando TUI correspondente. Mantenha as coisas simples na primeira execução:

  • GPU única
  • Precisão única (padrão para o caminho da GPU)
  • Solucionador baseado em pressão

Confirme se está ativo: no console/log do Fluent, você deve ver mensagens informando que um dispositivo de GPU foi inicializado e que os kernels do solucionador foram descarregados. Se os registros mostrarem caminhos somente da CPU, o recurso ou modelo selecionado talvez ainda não esteja coberto pela GPU.

6) Valide antes de escalar

Numéricos

  • Comece com uma precisão simples, se seu caso permitir; compare com uma pequena CPU de dupla precisão linha de base para algumas iterações/etapas de tempo.
  • Verifique a correspondência de resíduos, forças/coeficientes e uma métrica específica do domínio (por exemplo, queda de pressão) dentro de suas faixas de aceitação.

VRAM e malha

  • Relógio nvidia-smi para uso de memória.
  • Se você clicar em OOM, torne a malha mais grossa (dentro das regras de validação), reduza as saídas ou experimente uma GPU com mais VRAM.

Autoavaliação

  • Mesmo caso, mesmos critérios de parada, mesma física.
  • Registre o relógio de parede, as iterações/segundo e o custo por caso convergente.

Matemática de custos

custo_por_converged_case = preço_por_hora × horas_parede

7) Limites comuns (planeje em torno deles)

  • Cobertura de física está se expandindo, mas não é universal. Verifique suas notas de lançamento para combustão, multifase, acústica, radiação, etc.
  • Precisão dupla: o caminho da GPU favorece a precisão única. Se seu gabinete precisar ser executado em FP64, espere ganhos menores ou permaneça na CPU.
  • Várias GPUs existe em alguns casos, mas comece com GPU única para validar números e memória e, em seguida, escalar.
  • I/O pode dominar. Reduza a frequência de gravação, compacte registros e armazene dados no NVMe local.

8) Esqueleto mínimo do diário (adapte-se ao seu modelo)

Este é um padronizar, não um arquivo suspenso — substitua-o pelos comandos certos para sua física e sua versão.

/file/read-case-data case.cas.h5

; Ative a aceleração de GPU via TUI para sua versão
; (Use o comando documentado ou alterne em Geral → Aceleração de GPU)

/solve/inicialize/inicialize-flow
/solve/iterate 1000

/file/write-case-data out.cas.h5
/exit sim

Mantenha uma nota sobre métodos com: versão fluente, nome do caso, modelos físicos, sinalizador habilitado para GPU e critérios de interrupção.

9) Solução de problemas

“Dispositivo de GPU não encontrado/não inicializado”
Confirme nvidia-smi funciona dentro do contêiner. O modelo deve ter espaço de usuário CUDA e o host deve passar pelo driver (a computação faz isso). Se você usar sua própria imagem, combine CUDA com seu driver sempre que possível.

“Recurso não disponível no modo GPU”
Desligue o modelo não suportado ou execute o caso na CPU para esse estudo.

Sem memória (OOM)
Reduza o tamanho da malha ou as saídas; ou selecione um perfil com VRAM maior.

Erros de licença
Verifique seu ANSYSLMD_LICENSE_FILE e seu túnel VPN/SSH. Veja o guia de licenciamento.

Mais lento que a CPU
Nem todos os casos se beneficiam. Primeiro, crie um perfil com uma caixa pequena; considere a CPU se a física/malha não for bem mapeada para o caminho da GPU.

Trecho de métodos (copiar e colar)

hardware:
gpu: "<model>(<VRAM>GB)”
motorista: "<NVIDIA driver version>”
<CUDA version>cuda: "”
CPU: “<model/cores>”
software:
fluente: "<version>(solucionador de GPU ativado)”
os_image: “Ubuntu 24.04 LTS (CUDA 12.6)”
licenças:
responde: “ANSYSLMD_LICENSE_FILE= 1055@licenses.my-org.edu”
executar:
modo: “lote”
diário: “run.jou”
notas: “baseado em pressão, precisão única, GPU única”
saídas:
<hh:mm>horas_de_parede: "”
<value>iter_por_seg: "”
<residuals/metric>critérios_convergentes: “”

Leitura relacionada

Experimente o Compute hoje

Inicie uma instância de GPU com um modelo pronto para CUDA (por exemplo, Ubuntu 24.04 LTS/CUDA 12.6) ou sua própria imagem GROMACS. Aproveite o faturamento flexível por segundo com modelos personalizados e a capacidade de iniciar, interromper e retomar suas sessões a qualquer momento. Não tem certeza sobre os requisitos do FP64? Entre em contato com o suporte para ajudá-lo a selecionar o perfil de hardware ideal para suas necessidades computacionais.