¿Se avecina una nueva escasez de tarjetas gráficas por culpa de la IA?

¿Se avecina una nueva escasez de tarjetas gráficas por culpa de la IA?

Josep Roca

La demanda de hardware para la IA ha crecido exponencialmente en el último año, en especial el de las GPU. Esto hace que nos preguntemos si volveremos a ver una escasez de tarjetas gráficas como ocurrió con la minería no hace mucho. Para colmo, NVIDIA ha presentado en su GTC productos para suplir a dicho mercado, lo que hace que muchos se pregunten si va a volver la pesadilla.

Como cada mes de marzo, NVIDIA celebra su propia conferencia, la GTC, enfocada al mundo de la inteligencia artificial y la supercomputación. En ella no presentan nada para PC, sino productos y servicios en forma de software y hardware relacionados con la IA y para diferentes industrias. Sin embargo, el boom de aplicaciones como ChatGPT, Stable Diffusion y muchas más basadas en modelos de lenguaje de gran tamaño y generación de imágenes desde texto ha hecho que la demanda crezca en ese sentido. Y claro, los de Jen Hsen Huang lo tienen que aprovechar de alguna manera. Aunque lo que nos importa es como nos afecta a nosotros y ver si vamos a vivir de nuevo una escasez de tarjetas gráficas.

NVIDIA se sube al carro de ChatGPT y saca su tarjeta gráfica dual en años

Ya os comentamos hace poco que NVIDIA iba a buscar capitalizar el nuevo boom de la IA con dos elementos que son una obviedad. Por un lado, vendiendo tarjetas gráficas para que las grandes empresas y administraciones puedan montar sus servidores propios para dar o usar servicios basados en Deep o Machine Learning. Por el otro, la creación de servidores en la nube, por su parte, para que pequeñas y medianas empresas puedan acceder a dichos recursos.

Pues bien, respectivamente, y en el primer caso han presentado su NVIDIA H100 NVL Dual, la cual consiste en dos tarjetas gráficas interconectadas vía NVLink entre ellas. No se basan en la misma arquitectura que las RTX 40, sino en la pensada para el mercado de supercomputación, la H100. Su particularidad es que la cantidad de VRAM que disponen en total es de 188 GB del tipo HBM3, lo que significa que el sistema se reserva 2 GB por GPU para ciertas tareas. ¿Su mercado objetivo? El de los grandes modelos de lenguaje al estilo ChatGPT.

En cuanto al segundo producto es NVIDIA DGX Cloud, un servicio de supercomputación en la nube que da acceso a los servidores de NVIDIA para poder usar la potencia de sus GPU para aplicaciones centradas en la IA. Dichos servidores se basarán en Microsoft Azure y Google Cloud. La idea es que cualquier pequeña y mediana empresa puede alquilar dichos servidores.

Tarjetas Gráficas NVIDIA H100 NVL Dual

¿Habrá escasez de tarjetas gráficas para juegos?

Como se puede ver, NVIDIA no esta moviendo el stock de sus RTX 40 hacia el mercado de la IA, sino que esta usando su otro chip, el H100. Claro está que hemos de partir del hecho de tanto las últimas GeForce para PC como este poderoso chip salen de las mismas fundiciones al usar el nodo N4 de TSMC. Por lo que la demanda de uno va a acabar afectando a la demanda de otro en teoría, sin embargo, hemos de tener en cuenta una serie de puntos que son importantes:

  • Los márgenes de las tarjetas gráficas H100 son considerablemente más altos, incluso que una RTX 40, lo que cuesta una de las tarjetas gráficas para HPC de última generación de NVIDIA es casi 10 veces superior al que se está pagando por una RTX 4090.
  • Pese a la subida de la demanda, no va a ser tan grande como lo fue en el caso de la minería. Por lo que las tarjetas gráficas para gaming se encuentran a salvo.

Sin embargo, hemos de tener en cuenta que el chip H100 tiene un tamaño considerable, lo que significa que salen pocas unidades por oblea y el ratio de fallos es bastante grande. En todo caso, han tenido una enorme demanda por parte de las grandes multinacionales que pueden comprar este tipo de hardware. Pensad que para ChatGPT 3 se necesitaban 10.000 tarjetas gráficas para el entrenamiento de la IA, no sabemos cuantas serán para la nueva versión, pero varias veces más seguro que sí. Y no serán los únicos con demanda por dicho hardware. En todo caso, veremos si TSMC y NVIDIA tienen la capacidad para soportar esta demanda sin afectar su mercado más antiguo, aunque a día de hoy menos lucrativo.

1 Comentario