Precios de máquinas virtuales con GPU en la nube: lo que realmente estás pagando

La gente pregunta: «¿Cuánto cuesta una máquina virtual con GPU?» y esperan un solo número. En la práctica, el costo se reduce a dos palancas que controlas: la máquina que eliges y el tiempo que la dejas en funcionamiento.

En este artículo, se explica cómo funcionan los precios en Compute en términos sencillos, qué incluye y los pocos hábitos que hacen que los gastos sean predecibles. Si aún estás decidiendo si necesitas una máquina virtual, empieza aquí.

Cómo funcionan los precios de Compute

Compute usa créditos de prepago. Primero agregas créditos y, a continuación, tu saldo disminuye mientras la instancia está en ejecución. La consola muestra una tarifa por hora porque es fácil de leer, pero la facturación se basa en el tiempo de ejecución real, hasta el segundo. Más información sobre Facturación en Compute.

Esto también significa que «una prueba más» puede resultar económico si se ejecuta durante dos minutos y caro si te olvidas de la instancia de la noche a la mañana. El sistema no intenta engañarte. Es literal.

Qué está incluido (y qué no suele estar incluido)

Cuando las personas hablan de los precios de la nube, a menudo se refieren a «el número por hora» y se olvidan del resto de la factura. En Compute, la intención es que el precio que ves cubre lo básico que necesitas para correr: procesamiento, almacenamiento, tráfico de red, así como recursos clave como la memoria y los procesadores.

Muchas plataformas anuncian tarifas de GPU bajas, pero cobran por separado la CPU, la RAM, la memoria, los procesadores y el almacenamiento, lo que puede aumentar los costos generales.

Si desea la redacción exacta y canónica, trate el página de documentos y precios como fuente de la verdad porque eso es lo que se actualiza primero cuando algo cambia. Las tarifas ocultas, como los costos de transferencia de datos, las tarifas de almacenamiento y los cargos de configuración, pueden acumularse rápidamente y deben tenerse en cuenta al evaluar los costos totales.

Los dos verdaderos impulsores de costos

Elección de hardware

Los precios de las máquinas virtuales con GPU dependen principalmente del modelo de GPU y de la cantidad de GPU que conectas. Los precios pueden variar considerablemente según el modelo de GPU (por ejemplo, la NVIDIA A100 de 40 GB, la A100 de 80 GB, la H100, la B200 y las opciones de AMD) y del proveedor de servicios en la nube. Más GPU cuestan más. Más VRAM, memoria de GPU y memoria de sistema también suelen significar un precio más alto, ya que vienen con máquinas de mayor tamaño. El modelo de GPU y su aprovisionamiento son los principales impulsores de la tarifa base por hora; por ejemplo, las GPU de la generación actual, como la NVIDIA H100, pueden oscilar entre 2,10 y 15,00 dólares por hora, mientras que los modelos más antiguos, como la V100, oscilan entre 0,14 y 6,25 dólares por hora. La GPU NVIDIA A100 se usa habitualmente para cargas de trabajo de IA y está disponible a distintos precios en distintos proveedores de nube. La GPU NVIDIA H100 tiene un precio aproximado de 10$ por hora y la GPU NVIDIA B200 está disponible por unos 14$ la hora en determinadas configuraciones.

Si optas por la IA y el aprendizaje automático, el limitador práctico suele ser la VRAM, la memoria de GPU o la memoria. Las cargas de trabajo de IA suelen requerir GPU con mayor capacidad computacional y de VRAM, como las NVIDIA H100 o A100. Las GPU de gama alta, como las NVIDIA H100, A100 y B200, están optimizadas y diseñadas específicamente para cargas de trabajo de IA exigentes, mientras que las GPU de uso general son adecuadas para una gama más amplia de tareas. Los tipos de instancias de GPU varían mucho en términos de memoria, memoria de GPU y potencia de procesamiento (procesadores), lo que afecta a su idoneidad para diferentes cargas de trabajo. Las redes de gran ancho de banda entre las GPU son cruciales para la formación a gran escala y pueden conllevar costes adicionales. El coste de las máquinas virtuales con GPU también depende del acceso dedicado o compartido a la GPU, las tarifas de transferencia de datos, el almacenamiento y las redes.

Los clústeres de GPU se utilizan con frecuencia para cargas de trabajo de aprendizaje automático a gran escala, y elegir la configuración correcta es importante tanto para el coste como para el rendimiento. Al seleccionar una instancia de GPU, se deben tener en cuenta la variedad de operaciones matemáticas que gestionan los núcleos CUDA (procesadores) y la carga de trabajo general, especialmente porque las GPU desempeñan un papel fundamental en computación moderna para cargas de trabajo científicas y de inteligencia artificial. Esta descripción general le ayuda a elegir sin perderse en las especificaciones: Máquina virtual GPU: qué es y quién la necesita realmente.

Tiempo de ejecución

El tiempo de ejecución es la parte que la gente subestima. Si desea controlar los costos, esta es la palanca que más importa.

Si corres durante 12 minutos y 20 segundos, son 740 segundos. Pagas 740 segundos de ejecución, lo que equivale a 740/3600 de la tarifa por hora que se muestra. Eso es todo. Sin matemáticas misteriosas.

Transferencia de datos: el coste oculto de los precios de las máquinas virtuales con GPU

Los precios de las GPU en la nube se complican si miras más allá de las tarifas por hora. Los costos de transferencia de datos suelen sorprender a los equipos de IA que trabajan con grandes conjuntos de datos o con actualizaciones frecuentes de modelos. Si no tienes cuidado, estas tarifas pueden duplicar tu factura de la nube.

Los precios de transferencia de datos varían enormemente entre los proveedores. Algunos cobran por cada GB que entran o salen de su red. Otras incluyen la transferencia gratuita o el movimiento ilimitado dentro de su infraestructura. Una tarifa de GPU barata puede costarte miles de dólares más si transfieres terabytes de datos o resultados de entrenamiento. Necesitas tener un panorama completo de los costos, que incluya preguntas clave que debe hacerse antes de elegir un proveedor de procesamiento distribuido, antes de elegir un proveedor..

Estas son cinco formas de controlar los costos de transferencia de datos para su trabajo de IA:

Conozca el modelo de transferencia de su proveedor. Algunos incluyen la libre circulación de datos dentro de su red. Otros cobran por cada GB. Descubra lo que se incluye antes de mover conjuntos de datos de gran tamaño.
Utilice el almacenamiento de objetos para centralizar los datos. Almacena tus datos, modelos y resultados de entrenamiento en un solo lugar. Esto reduce las transferencias repetidas y mantiene los costos predecibles.
Compare los costos totales, no solo los precios de las instancias. Analiza las tasas de GPU y las comisiones de transferencia en conjunto. Una tarifa por hora más alta puede hacerte ahorrar dinero si la transferencia está incluida o es más barata.
Utilice la capacidad reservada cuando sea posible. Las cargas de trabajo predecibles reúnen los requisitos para obtener instancias reservadas y descuentos por uso. Con frecuencia, también incluyen mejores tarifas de transferencia y almacenamiento.
Rastrea y ajusta tu flujo de trabajo. Controla el uso de tus transferencias mensualmente. Agrupa tus archivos subidos, comprime los datos cuando puedas y reutiliza los conjuntos de datos que ya están almacenados en la nube.

Los costos de transferencia de datos son importantes para cualquier equipo que lleve a cabo capacitaciones o inferencias de IA a gran escala. Planifica con antelación y elige el enfoque correcto para evitar sorpresas en la facturación. Evalúe a los proveedores según el paquete completo: precios, rendimiento, almacenamiento, seguridad de los proveedores de computación certificados frente a los de la comunidad, y los costos ocultos que afectan a su presupuesto.

Cómo estimar los costos rápidamente (sin hojas de cálculo)

Usa la tarifa por hora que se muestra en la consola y conviértela en función de tu tiempo de ejecución.

Una hora son 3.600 segundos.

Costo ≈ tarifa por hora × (segundos corrientes/ 3.600)

El coste total se calcula multiplicando la tarifa por hora por la cantidad de GPU de la instancia y la fracción de la hora utilizada.

Si prefieres las matemáticas mentales, convierte tu tiempo de ejecución en una fracción de hora. Diez minutos son una sexta parte de una hora. Treinta minutos es la mitad. Cuanto más preciso seas, más acabarás utilizando la página de facturación de todos modos.

Los hábitos que mantienen el gasto bajo control

Deja todo lo que no estés usando. Esto suena obvio, pero es la mayor ganancia de costos. Si se detiene una instancia, se detiene la facturación informática. Cuando hayas terminado el día, termínala. El tiempo de inactividad durante el uso de la GPU hace que se paguen las máquinas virtuales en ejecución que no procesan cargas de trabajo de forma activa.

Considere las plataformas de GPU sin servidor. Las plataformas de GPU sin servidor, como Runpod o Cerebrium, ofrecen modelos de pago por ejecución que eliminan los costos de los tiempos de inactividad, lo que puede ser una buena opción para los desarrolladores y clientes que desean evitar pagar por los recursos no utilizados o que prefieren plataformas de nube de GPU rentables para IA y ML..

Empieza poco a poco mientras haces la depuración. Un error común es pagar por una configuración de GPU de gran tamaño mientras se siguen solucionando problemas básicos del entorno. Realiza la configuración y las primeras pruebas en un tamaño más pequeño. Amplíe cuando sepa que el flujo de trabajo es real. Tanto desarrolladores como clientes, especialmente las pymes que exploran Tendencias de IA que pueden aprovechar con la computación de GPU en la nube, puede beneficiarse de empezar con instancias más pequeñas y ampliarlas según sea necesario.

No pagues los precios de la GPU por el trabajo de la CPU. Muchas canalizaciones dedican tiempo a descargar, preprocesar, empaquetar o publicar una API ligera. Si la GPU está inactiva, estás pagando por un auto deportivo estacionado. Divida los pasos que requieren una gran cantidad de CPU en instancias de vCPU si eso se ajusta a su flujo de trabajo. Las instancias básicas pueden resultar más rentables para determinadas cargas de trabajo de alto rendimiento, pero las máquinas virtuales ofrecen más flexibilidad para la mayoría de los desarrolladores que desean un acceso escalable a Las GPU en la informática moderna a través de plataformas de nube distribuidas..

Trate la «parada» como una pausa, no como un almacenamiento. La detención es ideal para pausas breves y reinicios rápidos, pero no asumas que una instancia detenida es un archivo a largo plazo. Si necesitas conservar un entorno, haz copias de seguridad de lo que importa y planifica las reconstrucciones. El propósito de esta explicación es evitar sorpresas desagradables: ¿Guarda una máquina virtual mis cambios? Explicación de la persistencia en la computación.

Vigila tu equilibrio si tienes trabajos de larga duración. Como los créditos se pagan por adelantado, un período prolongado puede terminar antes de tiempo si tu saldo no puede cubrir más tiempo de ejecución. La mejor solución es sencilla: recargar antes de empezar o activar la recarga automática para no tener que hacer de canguro.

Algunas preguntas sobre precios que la gente busca

¿Facturan por segundo o por hora?

La interfaz de usuario muestra las tarifas por hora, pero la facturación es por segundo.

¿Debo pagar cuando se detiene la máquina virtual?

Los cargos de procesamiento se aplican mientras la instancia está en ejecución. Si la detienes o la cancelas, los cargos de procesamiento cesan.

¿Hay un gasto mínimo?

Por lo general, necesitará suficiente crédito para iniciar la configuración que elija. Si tienes poco dinero, recarga o elige una configuración más pequeña.

¿Cuál es la mejor manera de reducir los costos?

Ajusta el tamaño del hardware y detiene la instancia en el momento en que no la estés usando. Todo lo demás es de segundo orden.

Prueba Compute

Si quieres el enfoque más simple de «ver lo que cuesta», lanza una instancia pequeña, ejecuta una prueba breve y, a continuación, consulta la página de facturación. Aprenderás más de una tirada real que de cualquier teoría de precios.

‍

Cuando los estudiantes de IA superan el entorno limitado: cómo DSTI amplió su acceso a la GPU con Hivenet

La Escuela de Ingeniería DSTI se asoció con Hivenet para ofrecer a los estudiantes de máster un acceso más uniforme a una computación GPU europea asequible para proyectos reales de aprendizaje profundo.