Compute – Location de GPU et CPU

La puissance GPU et CPU qui offre exactement les performances promises, à chaque exécution.

Lancez des instances RTX 4090, RTX 5090, de la série RTX 6000 ou vCPU pour l'inférence IA, les modèles open source et open-weight, les expériences de fine-tuning, les notebooks, le rendu, les tâches par lots, les API et les environnements de développement. Bénéficiez de tarifs GPU fixes, d'une facturation à la seconde, d'options de déploiement régional et d'une infrastructure conçue pour la qualité au juste prix.

RTX 4090 à partir de €-/hr

RTX 5090 à partir de €-/hr

Série RTX 6000 pour les entreprises

Tarification prévisible

Facturation à la seconde

Modèles et images de système d'exploitation

Accès SSH

Organisations d'équipe

API Compute publique

Options de déploiement en France, aux EAU et aux États-Unis

Conseils pour les workloads

Dites-nous ce que vous voulez exécuter. On vous oriente.

Les chercheurs, les startups, les studios et les équipes d'entreprises gèrent les workloads de production sur cette infrastructure. Ce n'est pas un bac à sable.

Compute général

vCPU

Tests et recherche

RTX 4090

Débit d'IA spécialisé

RTX 5090

Workloads d'entreprise

Série RTX 6000

Point de terminaison API géré

API d'inférence

Équipes utilisant déjà Hivenet pour leurs calculs

Les chercheurs, les équipes d'IA, les studios et les groupes industriels exécutent leurs workloads GPU et CPU sur Compute avec Hivenet car les performances sont maintenues, les prix restent prévisibles et ils gardent le contrôle de l'environnement.

Quote marks

Hivenet nous facilite grandement le travail. Grâce aux notebooks Jupyter, à un accès rapide aux GPU et à une infrastructure fiable dans toutes les régions, nous avons pu accélérer nos recherches sur les enzymes vertes à usage industriel. C'est un véritable pas en avant pour les plateformes de calcul.

Notebooks Jupyter, accès rapide aux GPU, recherche sur les enzymes vertes.

Joseph Heenan

CEO chez Proteineer

Proteineer logotype
Quote marks

La possibilité d'obtenir facilement des instances avec cartes graphiques à un prix vraiment abordable. Je l'utilise quelques fois par mois et c'est vraiment parfait.

Nicolas B

PDG petite entreprise (sur G2)

Quote marks

Ce que nous apprécions chez Hivenet, c'est que cela correspond à notre vision de l'IA : durable, efficace et ancrée en Europe. Le modèle distribué nous apporte de la sécurité, l'option de choisir des modèles européens renforce notre message de souveraineté, et de petits détails comme la mise en pause des instances ou une tarification équitable rendent son utilisation quotidienne très pratique pour nous.

Durable, européen, souveraineté, tarification équitable.

Pablo Fernández

PDG @ ArtinLeap

ArtinLeap logotype
Quote marks

Nous sommes passés d'AWS et GCP à Hive. C'est un excellent moyen de réduire les coûts.

Sam Arrington

(sur Trustpilot)

Quote marks

Les GPU de Hivenet ont été essentiels pour faire évoluer nos projets d'IA. Ils nous permettent d'exécuter des modèles avancés en toute fluidité, garantissant ainsi des interactions rapides et réactives avec nos étudiants. Cette fiabilité a fait une réelle différence pour nous.

Fiabilité des GPU pour faire évoluer le travail en IA avec les étudiants.

Artem Gorelov

PDG @ Mytutor

Mytutor.io logotype
Quote marks

Installation ultra rapide. Tarification transparente. Démarrages à froid rapides. Machines fiables.

Anonyme

(sur Trustpilot)

Le calcul intensif nécessite plus qu'un faible coût horaire.

La rentabilité du calcul dépend de l'adéquation du workload à l'approche choisie. Commencez par la plus petite option qui exécute bien la tâche, mesurez les performances, puis passez à une option supérieure lorsque la mémoire, le débit, la latence ou les besoins opérationnels le justifient.

Prenez le contrôle total de la pile de service sur Compute, ou confiez-le à un point de terminaison géré avec Hivenet Inference. Dans les deux cas, vous exécutez les modèles open source que vous choisissez sur le matériel qui leur convient.

Une tarification que vous pouvez anticiper

Tarifs GPU fixes et facturation à la seconde aident les équipes à estimer les dépenses avant l'exécution.

Instances de taille adaptée

Choisissez vCPU, RTX 4090, RTX 5090 ou la série RTX 6000 en fonction de ce que le workload utilise réellement.

Workflows prêts pour les équipes

Utilisez les organisations, l'accès basé sur les rôles et la facturation partagée lorsqu'il y a plus d'une personne travaillant sur l'infrastructure.

Automatisation prête pour l'API

Utilisez l'API publique de Compute pour les scripts, le CI/CD, les outils internes et les workflows reproductibles.

N'importe qui peut annoncer un prix de GPU. Nous offrons le résultat complet.

Compute with Hivenet est conçu pour les équipes qui ont besoin de performances prévisibles, d'une adéquation parfaite du workload et d'un contrôle opérationnel réel. Si tout ce que vous voulez est le tarif le plus bas du marché, un fournisseur de GPU de type spot peut sembler moins cher jusqu'à ce que votre tâche soit interrompue, que vos coûts fluctuent et que vos ingénieurs perdent une journée. Si vous avez besoin d'une tarification prévisible, d'un déploiement régional, d'environnements reproductibles et d'un chemin clair de l'expérimentation à la production, Hivenet a été conçu pour ça.

La qualité au juste prix

Des tarifs GPU fixes et publiés signifient que vous connaissez les dépenses avant d'exécuter. La facturation à la seconde garantit l'équité pour les tâches courtes, facturées pour le temps réellement utilisé. Des performances prévisibles au juste prix, pas le chiffre le moins cher sur une place de marché.

La bonne instance, avant de gaspiller une exécution

Faites correspondre le modèle, la taille du lot, l'objectif de latence et le modèle d'exploitation au bon matériel, plutôt que de miser sur un nom de GPU et d'en payer les conséquences.

Workloads reproductibles

Les modèles, les images OS, les workflows SSH et votre propre pile technologique vous mènent des notebooks et des tests aux workloads de production reproductibles sans avoir à tout reconstruire à chaque fois.

Souverain et conforme

Déployez des workloads adaptés dans les régions disponibles, y compris la France, les Émirats arabes unis et les États-Unis, sur une infrastructure enterprise-grade exploitée de bout en bout par Hivenet, avec le contrôle et la portabilité nécessaires pour que le workload vous appartienne.

Une aide concrète pour les workloads importants

Contactez Hivenet lorsque le workload nécessite une intervention humaine : choix de l'instance, adéquation du modèle, configuration de production ou migration. Fini l'attente interminable des tickets.

Prêt pour toute votre équipe

Organisations, facturation partagée, accès basé sur les rôles et l'API publique de calcul pour les workloads qui dépassent la gestion par une seule personne via une console.

Besoin d'un point d'accès géré plutôt que d'une instance ?

Compute vous offre une infrastructure GPU ou CPU et un contrôle total sur la pile logicielle. Si vous souhaitez un point d'accès compatible OpenAI sans gérer vous-même la couche de service, utilisez l'API d'inférence Hivenet.

Workload

Chemin recommandé

Besoin

Application web, API, base de données de développement ou service d'arrière-plan

vCPU

Les workloads à usage général n'ont généralement pas besoin d'accélération GPU.

Je veux un point de terminaison compatible OpenAI

API d'inférence Hivenet

Hivenet opère la couche de service et le point de terminaison

Je veux de l'IA sur des données sensibles avec un accompagnement pour définir la voie à suivre

Private AI

Hivenet aide à cadrer le modèle, les données, l'infrastructure et le déploiement

J'ai besoin d'ensembles de données ou de stockage d'objets pour les pipelines d'IA

Stockage compatible S3

Stocker les documents, les ensembles de données, les entrées et sorties de modèles, et les artefacts de pipeline

Service de modèles de moins de 13B

RTX 4090

Excellent rapport coût-performance pour les modèles open-weight plus petits

Service de modèles de moins de 30B

RTX 5090

Plus de VRAM et de bande passante mémoire pour un débit GPU unique plus élevé

Tests de modèles de classe 70B

Hôte 8× RTX 5090

Possible avec le parallélisme tensoriel, mais la latence et le débit doivent être testés

Workloads de production enterprise

RTX série 6000

Marge de manœuvre d'entreprise pour les classes de modèles plus grandes et le service continu

Point de terminaison géré compatible OpenAI

Hivenet Inference

Compute vous donne une instance ; Inference vous donne un point de terminaison API géré

Faites glisser vers la gauche pour en voir plus

Optimisez la taille de l'instance. Maximisez la puissance de calcul par euro.

Compute avec Hivenet vous offre une infrastructure enterprise-grade avec un contrôle total de l'instance, de l'environnement et de la pile. Chaque GPU a une tâche.

RTX 4090 · Le GPU pour les tests et la recherche

L'outil performant et économique pour les tests, la recherche et le développement.

Optez pour la RTX 4090 lorsque le workload est plus petit, sensible aux coûts ou encore en développement. C'est le GPU sur lequel votre équipe réalise ses prototypes, mène ses expériences de recherche et développe avant de passer à l'échelle supérieure. Il fonctionne mieux sur Hivenet car la facturation à la seconde et les tarifs prévisibles rendent les tests itératifs peu coûteux à répéter.

Spécifications

24 Go de VRAM GDDR6X

Environ 1 To/s de bande passante mémoire

Ada Lovelace Tensor Cores

À partir de 0,40 €/h

Facturation à la seconde

Idéal pour

Inférence inférieure à 13B

Llama 3.1 8B

Mistral 7B

Qwen 7B/14B

Phi-4

Modèles fine-tunés de classe 7B

ComfyUI et génération d'images

Développement GPU rentable

RTX 5090 · Le GPU IA spécialisé

Débit GPU unique spécialisé pour l'IA exigeante.

Optez pour la RTX 5090 lorsque vous avez besoin d'une plus grande marge de manœuvre pour un seul GPU, d'un débit plus élevé et d'une prise en charge de classes de modèles pratiques plus grandes. C'est la spécialiste de l'inférence en production et du service à haute concurrence. Idéale sur Hivenet car vous obtenez cette catégorie de GPU à des tarifs prévisibles et pouvez la comparer à du bare metal.

Spécifications

32 Go de VRAM GDDR7

1,79 To/s de bande passante mémoire

Cœurs Tensor de 5e génération

PCIe 5.0

À partir de 0,75 €/h

Facturation à la seconde

Idéal pour

Inférence de moins de 30 milliards

Modèles petits et moyens à haute concurrence

Workloads Qwen, Llama, Mistral, Gemma, Phi et DeepSeek distillé

Pipelines de rendu et créatifs

Expériences intensives en CUDA

Pipelines de type HPC qui correspondent au profil matériel

Série RTX 6000 · Le GPU d'entreprise

Marge de manœuvre enterprise-grade pour les workloads à l'échelle de la production.

Optez pour la série RTX 6000 lorsque la production à grande échelle, les classes de modèles plus grandes ou les déploiements d'entreprise nécessitent plus de marge de manœuvre qu'un seul GPU grand public. C'est le niveau entreprise pour les équipes exécutant des workloads sérieux et continus. Idéal sur Hivenet car vous bénéficiez d'une capacité d'entreprise avec la même tarification prévisible et un contrôle de bout en bout.

Spécifications

32 Go de VRAM GDDR7

Bande passante mémoire de 1,79 To/s

Tensor Cores de 5e génération

PCIe 5.0

À partir de 0,75 €/h

Facturation à la seconde

Idéal pour

Déploiements en production d'entreprise

Classes de modèles plus grandes

Service à utilisation élevée et continue

Workloads exigeants, multi-locataires ou réglementés

vCPU · Calcul à usage général

Calcul à usage général, sans surcoût GPU.

Optez pour le vCPU lorsque votre workload n'a pas besoin d'accélération GPU.

Spécifications

Instances uniquement CPU

Options vCPU flexibles

Options fixes de RAM, de disque et de bande passante

Facturation à la seconde

Configuration simple pour les tâches informatiques quotidiennes

Tarification basée sur la configuration

Idéal pour

Applications web

API

Environnements de développement

Bases de données de test

Automatisation

CI/CD

Prétraitement

Services en arrière-plan

Associez le modèle open-source au GPU approprié.

Utilisez le tableau de compatibilité pour faire correspondre les classes de modèles open-source courantes à la capacité des RTX 4090, RTX 5090 ou RTX série 6000 avant de lancer.

Classe de modèle ou de workload

Compatibilité avec RTX 4090

Compatibilité avec RTX 5090

Notes

Llama 3.1 8B

Bonne adéquation

Bonne adéquation

Idéal pour l'inférence efficace et le développement

Mistral 7B

Forte adéquation

Forte adéquation

Idéal pour l'inférence à faible coût et les expériences

Qwen 7B/14B

Forte adéquation

Forte adéquation

Convient bien aux workloads open-weight plus petits

Phi-4

Forte adéquation

Forte adéquation

Idéal pour les flux de travail avec des modèles plus petits

Workloads avec Qwen 32B

Test d'adéquation

Forte adéquation

La RTX 5090 offre plus de marge de manœuvre

Mistral Small 3 24B

Test d'adéquation

Adéquation renforcée

Mieux adapté à la RTX 5090 pour un service pratique

DeepSeek-R1 distillé 7B/8B/14B

Très adapté

Très adapté

Bons candidats de modèles distillés

DeepSeek-R1 distillé 32B

Test d'adéquation

Plus adapté

Évaluation comparative avant utilisation en production

Modèles de classe 70B

Inadapté au mono-GPU

Uniquement multi-GPU

Nécessite un parallélisme tensoriel et des tests de latence

DeepSeek V3 complet

Ne convient pas

Ne convient pas

Nécessite une infrastructure de pointe plus importante

Service de production Kimi K2

Ne convient pas

Ne convient pas

Nécessite une infrastructure de pointe plus vaste

Faites glisser vers la gauche pour en voir plus

Demandez-nous d'examiner votre workload

Tarifs clairs. Facturé à la seconde. Prix axé sur le résultat.

Certaines tâches durent quelques minutes. D'autres tournent toute la nuit. Certaines restent inactives pendant qu'un test prend plus de temps que prévu. La facturation à la seconde vous aide à ne payer que ce que vous utilisez réellement, avec des performances prévisibles au juste prix.

RTX 4090

Prix de départ

- /h

Facturation à la seconde

Inférence de moins de 13B, fine-tuning, génération d'images, tâches GPU économiques

RTX 5090

Prix de départ

- /h

Facturation à la seconde

Inférence de moins de 30B, tâches GPU exigeantes, les meilleures performances mono-GPU sur Compute

vCPU

Prix de départ

- /h

Facturation à la seconde

API web, bases de données de développement, CI/CD, services d'arrière-plan, calcul généraliste

Aucun engagement à long terme requis. Utilisez des crédits prépayés, arrêtez les instances lorsque vous n'avez pas besoin de calcul actif, et terminez les instances lorsque vous avez terminé et n'avez plus besoin de stockage local.

Comparez les tarifs

Besoin d'une instance ou d'un point de terminaison géré ?

Utilisez Compute avec Hivenet lorsque vous souhaitez une infrastructure GPU ou CPU et un contrôle sur la pile. Utilisez Inférence Hivenet lorsque vous souhaitez un point de terminaison géré compatible OpenAI sans avoir à opérer vous-même la couche d'inférence.

Je veux un contrôle de niveau root sur une instance

Compute with Hivenet

Je veux exécuter moi-même vLLM, TGI, SGLang, llama.cpp, PyTorch ou Docker

Calcul avec Hivenet

Je veux un point de terminaison compatible OpenAI sans avoir à gérer la pile

Inférence Hivenet

Je veux de l'aide pour construire un système d'IA privé sur mes données

Private AI Hivenet

Je veux une puissance de calcul uniquement CPU pour des tâches généralistes

Compute with Hivenet vCPU

Créez-le une fois. Utilisez-le pour toujours.

Configurez l'environnement une seule fois, enregistrez-le comme modèle et relancez exactement le même workload chaque fois que vous en avez besoin. Pas de reconstruction à partir de zéro, pas de dérive entre les exécutions. Choisissez un conteneur ou une machine virtuelle, sélectionnez une région, sélectionnez un GPU ou un vCPU, choisissez un système d'exploitation ou un modèle, ajoutez votre clé SSH, configurez HTTPS, TCP ou UDP si nécessaire, et connectez-vous.

Se connecter en SSH à une VM

Exécutez Docker

Ouvrez un notebook Jupyter

Servez un modèle avec vLLM

Exposez une API via HTTPS

Exécutez des expériences PyTorch

Utilisez ComfyUI

Exécutez des tâches en arrière-plan

Réutilisez des modèles pour les workloads répétitifs

# Connectez-vous à votre instance
ssh ubuntu@your-instance

# Exécutez votre pile dans un conteneur
docker run --gpus all -p 8000:8000 your-image

# Ou servez un modèle open source avec vLLM
python -m vllm.entrypoints.openai.api_server \
   --model Qwen/Qwen2.5-7B-Instruct \
   --port 8000

# Relancez le même environnement, à chaque fois
curl -X POST https://api.hivenet.example/v1/instances \
   -H "Authorization: Bearer $HIVENET_API_KEY" \
   -d '{"template": "my-vllm-template", "gpu": "rtx5090", "region": "fr"}'

Démarrer une instance Compute

Ce que les équipes exécutent réellement sur Compute.

Compute avec Hivenet prend en charge la manière dont les équipes techniques travaillent réellement : accès partagé, facturation partagée, séparation des rôles et contrôle programmatique lorsque les flux de travail uniquement basés sur la console ne suffisent plus.

Accès d'équipe sans identifiants partagés

Créez une organisation, invitez des coéquipiers, attribuez des rôles et basculez entre les espaces de travail personnels et d'organisation.

Facturation partagée

Séparez les crédits de l'organisation des crédits personnels et laissez la bonne personne gérer les recharges et les méthodes de paiement.

Accès basé sur les rôles

Séparez la responsabilité de la facturation, la gestion des membres et des ressources, et la création et l'opération des instances.

API Public Compute

Créez, démarrez, arrêtez, terminez, listez, étiquetez et mettez à jour des instances de manière programmatique. Gérez les clés SSH, la facturation, les flux de travail organisationnels et les demandes de quota via des chemins d'API versionnés.

Conçu pour l'automatisation

Utilisez les ID de requête, les erreurs lisibles par machine, la pagination, la signalisation des limites de débit et la spécification OpenAPI pour connecter Compute à des scripts, des flux de travail CI/CD et des outils internes.

Contrôlez l'instance, pas seulement le plan de facturation.

Utilisez SSH, des modèles, des images OS, des instances GPU ou vCPU, des choix de régions et la facturation à la seconde pour exécuter vos workloads à votre manière. Pour les équipes ayant des workloads plus importants ou de production, Hivenet peut vous aider à évaluer l'adéquation, l'architecture et le chemin de migration avant de vous engager.

Découvrir notre approche de la confiance

Tarifs GPU prévisibles

Facturation à la seconde

Régions France, EAU et États-Unis

Accès SSH

Modèles et images OS

Options GPU et vCPU

Distinction claire entre le calcul brut et l'inférence gérée

Conseils pour les workloads des déploiements plus importants

FAQ

Questions fréquentes sur Compute

Commencez par la charge de travail.
Choisissez le chemin de calcul.

Louez une instance GPU ou CPU, automatisez Compute via l'API, ou discutez avec Hivenet pour trouver la configuration adaptée à votre équipe.

Shader gradient background

PoliCloud + Hivenet

30 % de réduction sur les forfaits Hivenet !

PoliCloud, propulsé par la technologie de Hivenet, redéfinit le stockage cloud souverain. Pour célébrer notre partenariat, nous offrons 30 % de réduction sur tous les forfaits Hivenet—pour une durée limitée !

*L'offre se termine le 31 mars 2025. Ne la manquez pas !

Lisez nos Conditions Générales