Memoria HBM2: ya no se usa en gráficas gaming por estos motivos

Redacción Actualizado el 19 de abril, 2024 • 12:01

La memoria HBM apareció por primera vez en las AMD R9 Fury hace ya casi una década y fue una constante en varias tarjetas gráficas para escritorio hasta la Radeon VII, la cual paso con más pena que gloría. Desde entonces las tarjetas gráficas gaming y la HBM2 no se llevan nada bien. ¿Cuál es el motivo por el cual este tipo de memoria ya no se usa y cómo se comparan la HBM2, la GDDR6 y la GDDR6X?

Índice

Muchas veces una tecnología puede parecer muy buena encima del papel, pero acabar siendo un fiasco comercial enorme por el hecho que lo que parecía en principio una gran idea trae consigo una serie de problemas que no se ven a simple vista que van apareciendo durante su desarrollo. Uno de estos casos es la memoria HBM2, la cual prometía hace ya varios años reemplazar a la memoria GDDR5 para siempre. ¿La realidad? La GDDR6 es la más utilizada en tarjetas gráficas para gaming. De la que se prometía que sería su sustituta se ha visto relegada al mercado de los servidores que emplean las llamadas GPU HPC.

Técnicamente y sobre el papel, si le preguntas a cualquier arquitecto de sistemas te va a decir que la HBM2 es un tipo de memoria mejor que la GDDR6. Entonces, ¿cómo es que no existe ni una sola RX 6000 de AMD o una RTX 30 de NVIDIA que la use si es tan buena? Esa es la pregunta que queremos responder con esta comparativa, y lo haremos de una forma que todos los lectores lo podáis entender.

¿Qué son las memorias HBM?

Es un tipo de memoria VRAM que se ha estandarizado para centros de datos y servidores. Su principal ventaja frente a otros tipos de memoria para gráficas reside en el ancho de banda. Como su nombre indica, son memorias con alto ancho de banda (HBM, por sus siglas en inglés). Además, también ofrecen mayor capacidad por cada chip con respecto a otras variantes de memorias gráficas.

Por supuesto, dentro de las memorias HBM tenemos también diferentes tipos y generaciones. Todo empezó con la memoria HBM, pero luego llegó la HBM2, HBM2E, y ahora mismo los principales fabricantes del mercado (Samsung, SK Hynix y Micron Technology) están en proceso de validación de la memoria HBM3e con NVIDIA. Y claro, como suele suceder siempre no podemos olvidarnos del siguiente paso intergeneracional, puesto que ya se sabe que la memoria HBM4 debería de llegar para el año 2026.

Como es lógico, cada nueva generación o variante de la memoria HBM supera en cuanto a características a la generación o variante anterior, es decir, ofrece un mejor rendimiento, más ancho de banda y generalmente menor consumo. Esto es el paso lógico (¿para qué si no ibas a lanzar una nueva generación?), pero lo importante es que a pesar de que no se utiliza demasiado salvo en las gráficas profesionales para IA de NVIDIA, las MI de AMD y las Gaudi de Intel, su desarrollo sigue en proceso y seguirá por bastante tiempo hasta que se encuentre una solución mejor.

Principales características

Vamos a ver de manera resumida las principales fortalezas de estas memorias:

Ofrece un ancho de banda superior a las memorias de tipo GDDR
Tienen una latencia muy baja, lo cual las hace especialmente interesantes para soluciones profesionales. Sobre todo se utilizan en tarjetas gráficas especiales de altas capacidades para Inteligencia Artificial y similares.
El consumo de energía por bit transmitido es prácticamente la mitad que el ofrecido por las memorias GDDR6
Permiten el apilamiento de varios chips de memoria, requiriendo una menor superficie para su instalación

Así funciona la memoria HBM

Para conseguir su alto ancho de banda, pero con un bajo consumo, lo que necesitan las memorias HBM usan una gran cantidad de pines de interconexión. El problema de este planteamiento es que esto significaría que el tamaño del chip aumentaría para interconectar de tú a tú cada pin con el chip de memoria correspondiente. Y no solo del chip gráfico, sino también de los de memoria. ¿La solución? Pues lo que se hace es enviar el cableado hacia abajo y usar una pieza adicional. El llamado Interposer, lo cual añade una complejidad adicional en costes y fabricación.

Por lo que el Interposer es un coste adicional sobre el proceso y complica el montaje del nuevo chip, aumentando la cantidad potencial de fallos durante el montaje. No solo eso, sino que debido a que los chips de memoria HBM se encuentran apilados no es tan simple como colocar unos encima de otros. Para que el chip arriba del todo de la pila se comunique con el Interposer, su cableado ha de atravesar verticalmente el resto de chips de memoria en la pila. Lo cual llamamos vías a través de silícico o TSV.

Para visualizarlo imaginad un bloque de pisos donde el suministro de agua y electricidad se encuentra en el piso de abajo y se ha de distribuir por todas las plantas. Pues lo mismo ocurre en el caso de la memoria HBM. Es por ello que es tan cara de fabricar y desde el momento en que en el mercado de consumo el precio es un valor importante a tener en cuenta. Entonces se acaba sacrificando las ventajas de espacio y consumo, a cambio de unos costes más bajos.

Uso de HBM en tarjetas gráficas gaming

El problema de las memorias HBM está en su proceso de fabricación. Las memorias GDDR6 son realmente sencillas de fabricar, por tener un diseño sencillo. Las HBM son muy complicadas de fabricar, ya que requiere de diferentes capas y vías de comunicación especiales entre ellas. El coste de un chip HBM suele ser, como mínimo, de dos veces el coste de un chip GDDR6.

Cierto que las tarjetas gráficas comerciales se podrían beneficiar de mayor cantidad de VRM, menor consumo y menor tamaño. El problema reside en que las memorias de alto ancho de banda encarecen brutalmente el producto. Hablamos de un encarecimiento de la tarjeta gráfica, tranquilamente, en un 20-25%.

Hay otro factor y es el impacto en el rendimiento. Aunque parezca increíble, el impacto en el rendimiento en juegos apenas sufrirá variaciones. Obviamente, obtendremos una mejora en la cantidad de FPS, que rondaría el 10%, pero que no compensa el sobrecoste.

Además, presentan un problema difícil de gestionar en las tarjetas gráficas comerciales. Se requiere estas memorias estén muy cerca de la GPU, en el mismo sustrato. Esto supone un problema, ya que puede generar una superficie no uniforme y el disipador de calor no actuar correctamente. Dicho problema se dio con las AMD RX Vega 64 que usaban HBM2. Existían diferencias de altura entre la GPU y las memorias HBM2, haciendo que la disipación del calor de las memorias fuera deficiente y generando problemas de estabilidad.

Comparativa entre GDDR6 y HBM2

La GDDR6 es la sexta generación de memorias Dual Data Rate enfocadas a su uso para tarjetas gráficas. Se diferencian de las RAM convencionales por el hecho que sacrifican latencia de acceso, algo que no afecta al chip gráfico, a cambio de conseguir altos anchos de banda, los cuales son esenciales a la hora de renderizar gráficos. En otras palabras, estamos ante un tipo de memoria que es ideal para usarla en una GPU, pero nefasta para un procesador central. Por eso no vemos módulos DIMM con GDDR6 para nuestro PC.

Característica	HBM2	GDDR6	GDDR6X
Chips por unidad	4 u 8	1	1
Capacidad por chip	2 GB (hasta 16 GB por unidad)	1 o 2 GB	1 o 2 GB
Bus	1024 bits	32 bits	32 bits
Canales	8 (128 bits por canal)	2 (16 bits por canal)	2 (16 bits por canal)
Velocidad de transferencia	De 2 Gbps a 2.4 Gbps	12 a 18 Gbps	19 a 21 Gbps
Otros	Requiere Interposer	Hasta 2 unidades compartiendo bus	Hasta 2 unidades compartiendo bus /Codificación PAM4

La GDDR6, en comparación con sus predecesores, supone un paso adelante, ya que cada chip se comporta como dos independientes, por el hecho de que ahora cada bus de datos de 16 bits tiene su propio bus de dirección /comando. En otras palabras, se trata de memoria de doble canal y, por tanto, puede responder a dos peticiones al mismo tiempo. La HBM2, en cambio, tiene la ventaja de tener una menor latencia, lo cual la hace idea para procesadores para servidores con decenas de núcleos, pero no para una tarjeta gráfica, y dispone de hasta 8 canales a memoria distintos, uno por cada chip que tengamos colocada en la pila.

GDDR6

La ventaja de la GDDR6 sobre la HBM2 se resume en una cosa, es mucho más barata y su uso generalizado ayuda a ello. No solo la vemos en tarjetas gráficas para PC, sino también en consolas de videojuegos. Si hiciéramos una comparativa del grueso de ventas de los productos según el tipo de memoria, entonces veríamos que el porcentaje de la HBM sería una cifra de un solo dígito.

La GDDR6X, ¿un adelanto al futuro?

Con la aparición de las NVIDIA RTX 30, en especial en las tarjetas gráficas más potentes dentro de dicha gama. Hemos podido ver la aparición en el mercado de la una variante de la GDDR6 a la que se la ha bautizado como GDDR6X. Su funcionamiento se basa en utilizar un tipo de codificación llamada PAM4, donde por cada pin de datos en vez de enviar valores 0 o 1 se envían los valores 00, 01, 10 y 11 a través de cambios en el voltaje.

Memorias GDDR6X RTX 30 40

En otras palabras, es una forma de aumentar el ancho de banda sin aumentar la velocidad de reloj a niveles alarmantemente altos y con ello bajar el consumo. Lo que ha permitido velocidades de hasta 21 Gbps y permitir velocidades de transferencia totales que antes solo eran posibles con una configuración HBM de 4 pilas o 4096 bits. Eso si, con unos consumos realmente altos. La historia es de nuevo la misma. Pese a que la GDDR6X es menos eficiente que cualquier otra memoria HBM, pero de nuevo es mucho más barata. Lo que ha provocado que la HBM haya dicho adiós en las GPU de alta gama.

El nuevo conector PCIe Gen 5 es el clavo en el ataúd

Antes os hemos comentado que uno de los puntos fuertes de las memorias HBM frente a la memoria GDDR6 es su menor consumo. Lo cual es una ventaja cuando te vas acercando peligrosamente a los límites de energía del conector de alimentación a la tarjeta gráfica. No olvidemos que durante años los 350 W de consumo han sido el límite. Por lo que una memoria más eficiente energéticamente como la HBM tenía mucho más sentido.

Las tarjetas gráficas PCI Express 5.0 traerán consigo un nuevo conector de hasta 600 W de potencia. Lo cual elimina la necesidad de una memoria más eficiente. En otras palabras: la memoria HBM2 se vuelve todavía más inútil en una tarjeta gráfica para gaming. Dado que uno de los problemas por los que fue creada originalmente ha desaparecido. Y sí, sería mucho mejor por motivos de ecologismo, un tipo de energía que consumiera mucho menos. No obstante, es lo que han decidido los participantes de la industria: aumentar el consumo del hardware.