
Compute – Location de GPU et CPU
Lancez des instances RTX 4090, RTX 5090, de la série RTX 6000 ou vCPU pour l'inférence IA, les modèles open source et open-weight, les expériences de fine-tuning, les notebooks, le rendu, les tâches par lots, les API et les environnements de développement. Bénéficiez de tarifs GPU fixes, d'une facturation à la seconde, d'options de déploiement régional et d'une infrastructure conçue pour la qualité au juste prix.
RTX 4090 à partir de €-/hr
RTX 5090 à partir de €-/hr
Série RTX 6000 pour les entreprises
Tarification prévisible
Facturation à la seconde
Modèles et images de système d'exploitation
Accès SSH
Organisations d'équipe
API Compute publique
Options de déploiement en France, aux EAU et aux États-Unis
Conseils pour les workloads
Les chercheurs, les startups, les studios et les équipes d'entreprises gèrent les workloads de production sur cette infrastructure. Ce n'est pas un bac à sable.
Les chercheurs, les équipes d'IA, les studios et les groupes industriels exécutent leurs workloads GPU et CPU sur Compute avec Hivenet car les performances sont maintenues, les prix restent prévisibles et ils gardent le contrôle de l'environnement.
La rentabilité du calcul dépend de l'adéquation du workload à l'approche choisie. Commencez par la plus petite option qui exécute bien la tâche, mesurez les performances, puis passez à une option supérieure lorsque la mémoire, le débit, la latence ou les besoins opérationnels le justifient.
Prenez le contrôle total de la pile de service sur Compute, ou confiez-le à un point de terminaison géré avec Hivenet Inference. Dans les deux cas, vous exécutez les modèles open source que vous choisissez sur le matériel qui leur convient.
Tarifs GPU fixes et facturation à la seconde aident les équipes à estimer les dépenses avant l'exécution.
Choisissez vCPU, RTX 4090, RTX 5090 ou la série RTX 6000 en fonction de ce que le workload utilise réellement.
Utilisez les organisations, l'accès basé sur les rôles et la facturation partagée lorsqu'il y a plus d'une personne travaillant sur l'infrastructure.
Utilisez l'API publique de Compute pour les scripts, le CI/CD, les outils internes et les workflows reproductibles.
Compute with Hivenet est conçu pour les équipes qui ont besoin de performances prévisibles, d'une adéquation parfaite du workload et d'un contrôle opérationnel réel. Si tout ce que vous voulez est le tarif le plus bas du marché, un fournisseur de GPU de type spot peut sembler moins cher jusqu'à ce que votre tâche soit interrompue, que vos coûts fluctuent et que vos ingénieurs perdent une journée. Si vous avez besoin d'une tarification prévisible, d'un déploiement régional, d'environnements reproductibles et d'un chemin clair de l'expérimentation à la production, Hivenet a été conçu pour ça.
Des tarifs GPU fixes et publiés signifient que vous connaissez les dépenses avant d'exécuter. La facturation à la seconde garantit l'équité pour les tâches courtes, facturées pour le temps réellement utilisé. Des performances prévisibles au juste prix, pas le chiffre le moins cher sur une place de marché.
Faites correspondre le modèle, la taille du lot, l'objectif de latence et le modèle d'exploitation au bon matériel, plutôt que de miser sur un nom de GPU et d'en payer les conséquences.
Les modèles, les images OS, les workflows SSH et votre propre pile technologique vous mènent des notebooks et des tests aux workloads de production reproductibles sans avoir à tout reconstruire à chaque fois.
Déployez des workloads adaptés dans les régions disponibles, y compris la France, les Émirats arabes unis et les États-Unis, sur une infrastructure enterprise-grade exploitée de bout en bout par Hivenet, avec le contrôle et la portabilité nécessaires pour que le workload vous appartienne.
Contactez Hivenet lorsque le workload nécessite une intervention humaine : choix de l'instance, adéquation du modèle, configuration de production ou migration. Fini l'attente interminable des tickets.
Organisations, facturation partagée, accès basé sur les rôles et l'API publique de calcul pour les workloads qui dépassent la gestion par une seule personne via une console.
Compute vous offre une infrastructure GPU ou CPU et un contrôle total sur la pile logicielle. Si vous souhaitez un point d'accès compatible OpenAI sans gérer vous-même la couche de service, utilisez l'API d'inférence Hivenet.
Workload
Chemin recommandé
Besoin
Application web, API, base de données de développement ou service d'arrière-plan
vCPU
Les workloads à usage général n'ont généralement pas besoin d'accélération GPU.
Je veux un point de terminaison compatible OpenAI
API d'inférence Hivenet
Hivenet opère la couche de service et le point de terminaison
Je veux de l'IA sur des données sensibles avec un accompagnement pour définir la voie à suivre
Private AI
Hivenet aide à cadrer le modèle, les données, l'infrastructure et le déploiement
J'ai besoin d'ensembles de données ou de stockage d'objets pour les pipelines d'IA
Stockage compatible S3
Stocker les documents, les ensembles de données, les entrées et sorties de modèles, et les artefacts de pipeline
Service de modèles de moins de 13B
RTX 4090
Excellent rapport coût-performance pour les modèles open-weight plus petits
Service de modèles de moins de 30B
RTX 5090
Plus de VRAM et de bande passante mémoire pour un débit GPU unique plus élevé
Tests de modèles de classe 70B
Hôte 8× RTX 5090
Possible avec le parallélisme tensoriel, mais la latence et le débit doivent être testés
Workloads de production enterprise
RTX série 6000
Marge de manœuvre d'entreprise pour les classes de modèles plus grandes et le service continu
Point de terminaison géré compatible OpenAI
Hivenet Inference
Compute vous donne une instance ; Inference vous donne un point de terminaison API géré
Compute avec Hivenet vous offre une infrastructure enterprise-grade avec un contrôle total de l'instance, de l'environnement et de la pile. Chaque GPU a une tâche.
Optez pour la RTX 4090 lorsque le workload est plus petit, sensible aux coûts ou encore en développement. C'est le GPU sur lequel votre équipe réalise ses prototypes, mène ses expériences de recherche et développe avant de passer à l'échelle supérieure. Il fonctionne mieux sur Hivenet car la facturation à la seconde et les tarifs prévisibles rendent les tests itératifs peu coûteux à répéter.
Spécifications
24 Go de VRAM GDDR6X
Environ 1 To/s de bande passante mémoire
Ada Lovelace Tensor Cores
À partir de 0,40 €/h
Facturation à la seconde
Idéal pour
Inférence inférieure à 13B
Llama 3.1 8B
Mistral 7B
Qwen 7B/14B
Phi-4
Modèles fine-tunés de classe 7B
ComfyUI et génération d'images
Développement GPU rentable
Optez pour la RTX 5090 lorsque vous avez besoin d'une plus grande marge de manœuvre pour un seul GPU, d'un débit plus élevé et d'une prise en charge de classes de modèles pratiques plus grandes. C'est la spécialiste de l'inférence en production et du service à haute concurrence. Idéale sur Hivenet car vous obtenez cette catégorie de GPU à des tarifs prévisibles et pouvez la comparer à du bare metal.
Spécifications
32 Go de VRAM GDDR7
1,79 To/s de bande passante mémoire
Cœurs Tensor de 5e génération
PCIe 5.0
À partir de 0,75 €/h
Facturation à la seconde
Idéal pour
Inférence de moins de 30 milliards
Modèles petits et moyens à haute concurrence
Workloads Qwen, Llama, Mistral, Gemma, Phi et DeepSeek distillé
Pipelines de rendu et créatifs
Expériences intensives en CUDA
Pipelines de type HPC qui correspondent au profil matériel
Optez pour la série RTX 6000 lorsque la production à grande échelle, les classes de modèles plus grandes ou les déploiements d'entreprise nécessitent plus de marge de manœuvre qu'un seul GPU grand public. C'est le niveau entreprise pour les équipes exécutant des workloads sérieux et continus. Idéal sur Hivenet car vous bénéficiez d'une capacité d'entreprise avec la même tarification prévisible et un contrôle de bout en bout.
Spécifications
32 Go de VRAM GDDR7
Bande passante mémoire de 1,79 To/s
Tensor Cores de 5e génération
PCIe 5.0
À partir de 0,75 €/h
Facturation à la seconde
Idéal pour
Déploiements en production d'entreprise
Classes de modèles plus grandes
Service à utilisation élevée et continue
Workloads exigeants, multi-locataires ou réglementés
Optez pour le vCPU lorsque votre workload n'a pas besoin d'accélération GPU.
Spécifications
Instances uniquement CPU
Options vCPU flexibles
Options fixes de RAM, de disque et de bande passante
Facturation à la seconde
Configuration simple pour les tâches informatiques quotidiennes
Tarification basée sur la configuration
Idéal pour
Applications web
API
Environnements de développement
Bases de données de test
Automatisation
CI/CD
Prétraitement
Services en arrière-plan
Utilisez le tableau de compatibilité pour faire correspondre les classes de modèles open-source courantes à la capacité des RTX 4090, RTX 5090 ou RTX série 6000 avant de lancer.
Classe de modèle ou de workload
Compatibilité avec RTX 4090
Compatibilité avec RTX 5090
Notes
Llama 3.1 8B
Bonne adéquation
Bonne adéquation
Idéal pour l'inférence efficace et le développement
Mistral 7B
Forte adéquation
Forte adéquation
Idéal pour l'inférence à faible coût et les expériences
Qwen 7B/14B
Forte adéquation
Forte adéquation
Convient bien aux workloads open-weight plus petits
Phi-4
Forte adéquation
Forte adéquation
Idéal pour les flux de travail avec des modèles plus petits
Workloads avec Qwen 32B
Test d'adéquation
Forte adéquation
La RTX 5090 offre plus de marge de manœuvre
Mistral Small 3 24B
Test d'adéquation
Adéquation renforcée
Mieux adapté à la RTX 5090 pour un service pratique
DeepSeek-R1 distillé 7B/8B/14B
Très adapté
Très adapté
Bons candidats de modèles distillés
DeepSeek-R1 distillé 32B
Test d'adéquation
Plus adapté
Évaluation comparative avant utilisation en production
Modèles de classe 70B
Inadapté au mono-GPU
Uniquement multi-GPU
Nécessite un parallélisme tensoriel et des tests de latence
DeepSeek V3 complet
Ne convient pas
Ne convient pas
Nécessite une infrastructure de pointe plus importante
Service de production Kimi K2
Ne convient pas
Ne convient pas
Nécessite une infrastructure de pointe plus vaste
Certaines tâches durent quelques minutes. D'autres tournent toute la nuit. Certaines restent inactives pendant qu'un test prend plus de temps que prévu. La facturation à la seconde vous aide à ne payer que ce que vous utilisez réellement, avec des performances prévisibles au juste prix.
Prix de départ
Facturation à la seconde
Inférence de moins de 13B, fine-tuning, génération d'images, tâches GPU économiques
Prix de départ
Facturation à la seconde
Inférence de moins de 30B, tâches GPU exigeantes, les meilleures performances mono-GPU sur Compute
Prix de départ
Facturation à la seconde
API web, bases de données de développement, CI/CD, services d'arrière-plan, calcul généraliste
Aucun engagement à long terme requis. Utilisez des crédits prépayés, arrêtez les instances lorsque vous n'avez pas besoin de calcul actif, et terminez les instances lorsque vous avez terminé et n'avez plus besoin de stockage local.
Utilisez Compute avec Hivenet lorsque vous souhaitez une infrastructure GPU ou CPU et un contrôle sur la pile. Utilisez Inférence Hivenet lorsque vous souhaitez un point de terminaison géré compatible OpenAI sans avoir à opérer vous-même la couche d'inférence.
Configurez l'environnement une seule fois, enregistrez-le comme modèle et relancez exactement le même workload chaque fois que vous en avez besoin. Pas de reconstruction à partir de zéro, pas de dérive entre les exécutions. Choisissez un conteneur ou une machine virtuelle, sélectionnez une région, sélectionnez un GPU ou un vCPU, choisissez un système d'exploitation ou un modèle, ajoutez votre clé SSH, configurez HTTPS, TCP ou UDP si nécessaire, et connectez-vous.
Se connecter en SSH à une VM
Exécutez Docker
Ouvrez un notebook Jupyter
Servez un modèle avec vLLM
Exposez une API via HTTPS
Exécutez des expériences PyTorch
Utilisez ComfyUI
Exécutez des tâches en arrière-plan
Réutilisez des modèles pour les workloads répétitifs
# Connectez-vous à votre instance
ssh ubuntu@your-instance
# Exécutez votre pile dans un conteneur
docker run --gpus all -p 8000:8000 your-image
# Ou servez un modèle open source avec vLLM
python -m vllm.entrypoints.openai.api_server \
--model Qwen/Qwen2.5-7B-Instruct \
--port 8000
# Relancez le même environnement, à chaque fois
curl -X POST https://api.hivenet.example/v1/instances \
-H "Authorization: Bearer $HIVENET_API_KEY" \
-d '{"template": "my-vllm-template", "gpu": "rtx5090", "region": "fr"}'
Compute avec Hivenet prend en charge la manière dont les équipes techniques travaillent réellement : accès partagé, facturation partagée, séparation des rôles et contrôle programmatique lorsque les flux de travail uniquement basés sur la console ne suffisent plus.
Créez une organisation, invitez des coéquipiers, attribuez des rôles et basculez entre les espaces de travail personnels et d'organisation.
Séparez les crédits de l'organisation des crédits personnels et laissez la bonne personne gérer les recharges et les méthodes de paiement.
Séparez la responsabilité de la facturation, la gestion des membres et des ressources, et la création et l'opération des instances.
Créez, démarrez, arrêtez, terminez, listez, étiquetez et mettez à jour des instances de manière programmatique. Gérez les clés SSH, la facturation, les flux de travail organisationnels et les demandes de quota via des chemins d'API versionnés.
Utilisez les ID de requête, les erreurs lisibles par machine, la pagination, la signalisation des limites de débit et la spécification OpenAPI pour connecter Compute à des scripts, des flux de travail CI/CD et des outils internes.
Utilisez SSH, des modèles, des images OS, des instances GPU ou vCPU, des choix de régions et la facturation à la seconde pour exécuter vos workloads à votre manière. Pour les équipes ayant des workloads plus importants ou de production, Hivenet peut vous aider à évaluer l'adéquation, l'architecture et le chemin de migration avant de vous engager.
Découvrir notre approche de la confianceTarifs GPU prévisibles
Facturation à la seconde
Régions France, EAU et États-Unis
Accès SSH
Modèles et images OS
Options GPU et vCPU
Distinction claire entre le calcul brut et l'inférence gérée
Conseils pour les workloads des déploiements plus importants
FAQ
Louez une instance GPU ou CPU, automatisez Compute via l'API, ou discutez avec Hivenet pour trouver la configuration adaptée à votre équipe.