La memoria HBM apareció por primera vez en las AMD R9 Fury hace ya casi una década y fue una constante en varias tarjetas gráficas para escritorio hasta la Radeon VII, la cual paso con más pena que gloria. Desde entonces las tarjetas gráficas gaming y la memoria HBM no se llevan nada bien. ¿Cuál es el motivo por el cual este tipo de memoria ya no se usa y cómo se comparan la memoria HBM y la memoria la GDDR?
Muchas veces una tecnología puede parecer muy buena encima del papel, pero acabar siendo un fiasco comercial enorme por el hecho que lo que parecía en principio una gran idea trae consigo una serie de problemas que no se ven a simple vista que van apareciendo durante su desarrollo.
Uno de estos casos es la memoria HBM2, la cual prometía hace ya varios años reemplazar a la memoria GDDR5 para siempre. ¿La realidad? Llegó GDDR6 y se convirtió en la opción más utilizada por todos los fabricantes de tarjetas gráficas gaming. De la que se prometía que sería su sustituta se ha visto relegada al mercado de los servidores que emplean las llamadas GPU HPC (computación de alto rendimiento).
Técnicamente y sobre el papel, si le preguntas a cualquier arquitecto de sistemas te va a decir que la HBM es un tipo de memoria mejor que la GDDR. Entonces, ¿cómo es que no se ha lanzado al mercado ninguna gráfica para uso doméstico con memoria HBM? Esa es la pregunta que queremos responder con esta comparativa, y lo haremos de una forma que todos los lectores lo podáis entender y comprender las razones que hay detrás para una decisión que, sobre el papel, parece más que equivocada.
Qué es la memoria HBM
Es un tipo de memoria VRAM que se ha estandarizado para centros de datos y servidores. Su principal ventaja frente a otros tipos de memoria para gráficas reside en el ancho de banda. Como su nombre indica, son memorias con alto ancho de banda (HBM, High Bandwidth Memory). Además, también ofrecen mayor capacidad por cada chip con respecto a otras variantes de memorias gráficas por lo que son, a priori, perfectas para un componente tan exigente como es la tarjeta gráfica. ¿No os parece?
Por supuesto, dentro de las memorias HBM tenemos también diferentes tipos y generaciones. Todo empezó con la memoria HBM, pero luego llegó la HBM2, HBM2E, y ahora mismo los principales fabricantes del mercado (Samsung, SK Hynix y Micron Technology) han validado la memoria HBM3 y HBM3e con NVIDIA.
Y claro, como suele suceder siempre no podemos olvidarnos del siguiente paso intergeneracional, puesto que ya se sabe que la memoria HBM4 debería de llegar para el año 2026. Largo me lo fiais, que diría el clásico literario, pero es por eso que os avisamos, para que entendáis que lejos de estar en desuso, este tipo de componentes siguen muy vivos dentro del mercado de la informática.
Como es lógico, cada nueva generación o variante de la memoria HBM supera en cuanto a características a la generación o variante anterior, es decir, ofrece un mejor rendimiento, más ancho de banda y generalmente menor consumo. Esto es el paso lógico (¿para qué si no ibas a lanzar una nueva generación?), pero lo importante es que a pesar de que no se utiliza demasiado salvo en las gráficas profesionales para IA de NVIDIA, las MI de AMD y las Gaudi de Intel, su desarrollo sigue en proceso y seguirá por bastante tiempo hasta que se encuentre una solución mejor.
Características
Vamos a ver de manera resumida las principales fortalezas de estas memorias, para que comprendáis exactamente cuál es el fundamento que hay detrás de su existencia, desarrollo y evolución:
- Ofrece un ancho de banda superior a las memorias de tipo GDDR.
- Tienen una latencia muy baja, lo cual las hace especialmente interesantes para soluciones profesionales. Sobre todo se utilizan en tarjetas gráficas especiales de altas capacidades para Inteligencia Artificial y similares.
- El consumo de energía por bit transmitido es prácticamente la mitad que el ofrecido por las memorias GDDR.
- Permiten el apilamiento de varios chips de memoria, requiriendo una menor superficie para su instalación.
Cómo funciona
Para conseguir su alto ancho de banda, pero con un bajo consumo, lo que necesitan las memorias HBM usan una gran cantidad de pines de interconexión. El problema de este planteamiento es que esto significaría que el tamaño del chip aumentaría para interconectar de tú a tú cada pin con el chip de memoria correspondiente. Y no solo del chip gráfico, sino también de los de memoria. ¿La solución? Pues lo que se hace es enviar el cableado hacia abajo y usar una pieza adicional. El llamado Interposer, lo cual añade una complejidad adicional en costes y fabricación.
Por lo que el Interposer es un coste adicional sobre el proceso y complica el montaje del nuevo chip, aumentando la cantidad potencial de fallos durante el montaje. No solo eso, sino que debido a que los chips de memoria HBM se encuentran apilados no es tan simple como colocar unos encima de otros. Para que el chip arriba del todo de la pila se comunique con el Interposer, su cableado ha de atravesar verticalmente el resto de chips de memoria en la pila. Lo cual llamamos vías a través de silícico o TSV.
Para visualizarlo imaginad un bloque de pisos donde el suministro de agua y electricidad se encuentra en el piso de abajo y se ha de distribuir por todas las plantas. Pues lo mismo ocurre en el caso de la memoria HBM. Es por ello que es tan cara de fabricar y desde el momento en que en el mercado de consumo el precio es un valor importante a tener en cuenta. Entonces se acaba sacrificando las ventajas de espacio y consumo, a cambio de unos costes más bajos.
Por qué no se utiliza memoria HBM en gráficas gaming
El problema de las memorias HBM está en su proceso de fabricación. Las memorias GDDR son realmente sencillas de fabricar, por tener un diseño sencillo. Las HBM son muy complicadas de fabricar, ya que requiere de diferentes capas y vías de comunicación especiales entre ellas. El coste de un chip HBM suele ser, como mínimo, de dos veces el coste de un chip GDDR por lo que esa es razón suficiente como para que cualquier fabricante opte por el menor de los males. Que es equipar sus gráficas con chips GDDR.
Cierto que las tarjetas gráficas comerciales se podrían beneficiar de mayor cantidad de VRM, menor consumo y menor tamaño. El problema reside en que las memorias de alto ancho de banda encarecen brutalmente el producto. Hablamos de un encarecimiento de la tarjeta gráfica, tranquilamente, en un 20-25% y con los precios que tienen ya algunos modelos, sumarle este extra supondría superar límites por los que muchos gamers no estarían dispuestos a pasar.
Hay otro factor en juego y es el impacto en el rendimiento. Aunque parezca increíble, el impacto en el rendimiento en juegos apenas sufrirá variaciones. Obviamente, obtendremos una mejora en la cantidad de FPS, que rondaría el 10%, pero que no compensa el sobrecoste económico de hacernos con una gráfica equipada con memoria HBM.
Además, presentan un problema difícil de gestionar en las tarjetas gráficas comerciales. Se requiere que estas memorias estén muy cerca de la GPU, en el mismo sustrato. Esto supone un problema, ya que puede generar una superficie no uniforme y el disipador de calor no actuar correctamente. Dicho problema se dio con las AMD RX Vega 64 que usaban HBM2. Existían diferencias de altura entre la GPU y las memorias HBM2, haciendo que la disipación del calor de las memorias fuera deficiente y generando problemas de estabilidad, lo que obviamente redunda en un rendimiento por debajo de lo que es capaz el hardware en sí.
Actualmente las tarjetas gráficas orientadas para juegos ya tienen precios bastante altos, la implementación de HBM realmente lo único que implicaría sería un aumento de precio innecesario ya que el factor más limitante de estos componentes no se encuentra en la propia memoria, las versiones más avanzadas como GDDR7 demuestran que pueden funcionar perfectamente. En los casos recientes vemos cómo cada vez hay más modelos que utilizan una generación de memoria anterior, con la llegada de las RTX 50 NVIDIA es la única que ha dado el salto a GDDR7, los modelos RX 9000 de AMD continúan utilizando GDDR6 para reducir los costes de producción, al igual que Intel con la serie Intel Arc B.
Pero incluso en este aspecto los modelos de esta marca logran ofrecer un rendimiento superior en las versiones de las gamas más bajas, mientras que las gamas medio-altas no tienen una diferencia tan grande en comparación con las de su principal competidor, demostrando que el cambio de memoria, pese a representar un aumento de rendimiento, no implica una mejora sustancial. Conociendo esto tan solo necesitaríamos imaginar cuál sería el propósito de integrar alguna de las versiones más actuales de HBM en una gráfica para gaming, en este caso no es algo que merezca realmente la pena.
Comparativa entre GDDR y HBM
La GDDR6 es la sexta generación de memorias Dual Data Rate enfocadas a su uso para tarjetas gráficas. Se diferencian de las RAM convencionales por el hecho que sacrifican latencia de acceso, algo que no afecta al chip gráfico, a cambio de conseguir altos anchos de banda, los cuales son esenciales a la hora de renderizar gráficos. En otras palabras, estamos ante un tipo de memoria que es ideal para usarla en una GPU, pero nefasta para un procesador central.
| Característica | GDDR6 | GDDR7 | HBM3e / HBM4 (IA/Pro) |
|---|---|---|---|
| Arquitectura | 2D Plana (en PCB) | 2D Plana (en PCB) | 3D Apilada (en Chip) |
| Velocidad por Pin | 14 - 16 Gbps | 32 - 40 Gbps | ~9.2 Gbps (pero con miles de pines) |
| Ancho de Bus | 32 bits por chip | 32 bits por chip | 1024 bits por pila |
| Ancho de Banda Máx. | ~448 - 768 GB/s (total) | ~1.5 TB/s (total) | +1.2 TB/s (por pila) |
| Voltaje | 1.35V | 1.2V | 1.1V (más eficiente) |
| Tipo de Señal | NRZ | PAM3 (más datos por ciclo) | NRZ |
| Uso Común | GPUs Gaming (RTX 4060/70) / AMD RX 9000 / Intel Arc B Series | RTX 50 Series | NVIDIA H200 / Blackwell - AMD Instinct MI |
| Costo de Fab. | Bajo / Medio | Medio / Alto | Muy Alto |
Memoria GDDR6
La GDDR6, en comparación con sus predecesores, supone un paso adelante, ya que cada chip se comporta como dos independientes, por el hecho de que ahora cada bus de datos de 16 bits tiene su propio bus de dirección /comando. En otras palabras, se trata de memoria de doble canal y, por tanto, puede responder a dos peticiones al mismo tiempo. La HBM2, en cambio, tiene la ventaja de tener una menor latencia, lo cual la hace idea para procesadores para servidores con decenas de núcleos, pero no para una tarjeta gráfica, y dispone de hasta 8 canales a memoria distintos, uno por cada chip que tengamos colocada en la pila.
La ventaja de la GDDR6 sobre la HBM2 se resume en una cosa, es mucho más barata y su uso generalizado ayuda a ello. No solo la vemos en tarjetas gráficas para PC, sino también en consolas de videojuegos. Si hiciéramos una comparativa del grueso de ventas de los productos según el tipo de memoria, entonces veríamos que el porcentaje de la HBM sería una cifra de un solo dígito.
Memoria GDDR6X
Con el lanzamiento de la serie RTX 30 de NVIDIA, en especial en las tarjetas gráficas más potentes dentro de dicha gama. Llegó al mercado una variante de la GDDR6 a la que se la ha bautizado como GDDR6X. Su funcionamiento se basa en utilizar un tipo de codificación llamada PAM4, donde por cada pin de datos en vez de enviar valores 0 o 1 se envían los valores 00, 01, 10 y 11 a través de cambios en el voltaje.
En otras palabras, es una forma de aumentar el ancho de banda sin aumentar la velocidad de reloj a niveles alarmantemente altos y con ello bajar el consumo. Lo que ha permitido velocidades de hasta 21 Gbps y permitir velocidades de transferencia totales que antes solo eran posibles con una configuración HBM de 4 pilas o 4096 bits. Eso si, con unos consumos realmente altos. La historia es de nuevo la misma. Pese a que la GDDR6X es menos eficiente que cualquier otra memoria HBM, pero de nuevo es mucho más barata. Lo que ha provocado que la HBM haya dicho adiós en las GPU de alta gama.
Memoria GDDR7
Aunque en un principio eran muchas las personas que decían que las tarjetas gráficas de nueva generación iban a usar HBM, como bien sabemos las marcas principales han decidido optar por continuar utilizando su principal rival que llega con una nueva versión, GDDR7. En este aspecto sabemos que uno de los motivos por los que se sigue utilizando es porque resulta bastante más barato de implementar, mientras que ofrece lo necesario para superar cada vez a la generación anterior, algo que a su vez permite crear hardware mucho más potente que cuenta con ventajas tecnologías muy superiores.
En este aspecto, GDDR7 es el nuevo estándar que llega para superar al anterior que hemos visto, ya que las velocidades que ofrece son muy superiores, permitiendo crear generaciones que en términos de rendimiento mejoran más de 20%. Muchas personas pueden pensar que este aumento de potencia puede implicar también una subida de precios, ya que estamos hablando de que en comparación con los modelos anteriores que podían llegar hasta 21 Gbps, estos en comparación ofrecen 30 Gbps o incluso más, demostrando las capacidades técnicas que pueden llegar a tener.
Pero el precio realmente no cambia tanto en comparación con lo que hemos visto anteriormente en las diversas gráficas del mercado, por ejemplo, las gráficas de NVIDIA pertenecientes a las RTX 50 ofrecen, de hecho, un precio de venta base inferior al que tenían las RTX 40. En el caso de la RTX 5070, podemos observar que el precio de lanzamiento oficial que tienen es de 550 dólares, mientras que las RTX 4070 cuando salieron costaban 600 dólares (con un cambio a euros que aumenta bastante el precio por los impuestos como ya sabemos), por lo que podemos ver que en este caso, ha afectado de forma positiva reduciendo el precio base de estos modelos.
