Las claves de la nueva memoria para tarjetas gráficas: así es HBM3

Las claves de la nueva memoria para tarjetas gráficas: así es HBM3

Josep Roca

La JEDEC acaba de presentar la tercera generación de la High Bandwidth Memory. ¿Qué novedades y cambios nos trae la memoria HBM3 respecto a sus antecesoras y donde vamos a ver utilizada este tipo de memoria RAM en un futuro cercano? Veamos cuáles son las respuestas a esas preguntas.

A día de hoy no existe una sola tarjeta gráfica para el mercado gaming que haga uso de memoria del tipo HBM, no obstante si nos vamos al mundo de la computación de alto rendimiento o HPC estos tipos de memorias son altamente usados. Así pues, podemos ver diseños como las Instinct de AMD, la serie Tesla de NVIDIA o la futura Ponte Vecchio de Intel que hacen uso de memoria HBM2E.

Todo hardware tiene su sucesor, y las futuras tarjetas gráficas pensadas para tareas de cómputo pesado harán uso de la HBM3. Estamos hablando de arquitecturas como AMD CDNA 3, Ponte Vecchio 2 por parte de Intel e incluso NVIDIA Hopper.

¿Qué es la memoria HBM3?

HBM Interposer Render

Cómo su nombre indica se trata de la tercera generación de la llamada High Bandwidth Memory, un tipo de memoria estándar definido por la JEDEC que se diferencia de las clásicas memorias DDR y GDDR por la forma en la que funciona su interfaces de comunicación con los procesadores a los que están conectados. Su particularidad es que su cableado en vez de estar conectado en horizontal con la CPU o GPU a la que acompañan lo están a un interposer que tienen por debajo con el que tienen contacto en vertical, al cual también está conectado su procesador acompañante.

Gracias a esto las interconexiones se pueden hacer en matriz en vez de hacerse en serie, lo que permite aumentar la cantidad de las mismas por área. ¿Y qué efectos tiene esto? Una de las ventajas que tiene esto es que les permite apilar varios chips de memoria uno encima del otro para ocupar menos espacio. Para ello se utilizan vías a través del silicio o TSV para intercomunicar los chips de memoria superiores en la pila con los inferiores. En este caso funcionan de manera muy similar a la 3D NAND.

pj bit RAM

La segunda ventaja de la HBM3 y sus antecesores es una reducción considerable en el consumo energético, ya que este aumenta exponencialmente con la velocidad de reloj y no solo cuando un chip procesa datos, sino también cuando hay envíos de los mismos. El hecho de utilizar una mayor cantidad de pines, bits de transferencia por ciclo de reloj, en las memorias HBM3 y sus antecesoras es que no requieren alcanzar velocidades de reloj tan altas para alcanzar

¿La ventaja? El hecho de tener un consumo energético, medido en pJ por bit mucho más bajo que el resto de memorias y poder alcanzar los mismos anchos de banda que una GDDR6 consumiendo la mitad de energía con la HBM2E. Además, el uso del interposer le da una latencia mucho menor que las clásicas memorias. No obstante todo ello tiene un precio y nunca mejor dicho, ya que pese a sus ventajas son muy caras de fabricar, lo que hace que estas memorias se utilicen en entornos de computación de alto rendimiento y lejos del alcance del usuario doméstico e incluso del profesional que utiliza estaciones de trabajo.

Cambios en la memoria HBM3

SK Hynix Memoria HBM3

Con la publicación por parte de la JEDEC del estándar HBM3, por fin podemos hablar de ella de manera objetiva y no de las propuestas realizadas por los diferentes fabricantes en todos estos años de cara al nuevo estándar. Y se puede decir que se han producido cambios significativos respecto a la generación anterior de este tipo de memorias.

Más velocidad

GPU HBM Render

Uno de los cambios que más nos han sorprendido es el hecho que en vez de duplicar la cantidad de pines y pasar a usar un bus de 2048 bits por canal de memoria. Lo que han hecho en la HBM3 es aumentar de los 3,2 Gbps en la HBM2E más avanzada a los 6,4 Gbps duplicando con ello la velocidad de reloj. Se trata de un cambio importante en la filosofía de las memorias HBM que se traducirá en un mayor consumo energético de las tarjetas gráficas que las empleen.

Este cambio ha sido seguramente motivado por los cambios en la interfaz PCI Express  que permiten tener tarjetas gráficas de hasta 600 W. Esto le da margen a la HBM3 para alcanzar el doble de ancho de banda sin hacer que la interfaz de memoria sea el doble de ancha. Sin embargo, tal y como ocurre con cada nueva iteración de memoria se ha hecho servir la capacidad de los nuevos nodos de fabricación para bajar el voltaje a periodos que van de los 0.4 V y los 1.1 V y con ello paliar la subida de velocidad de reloj.

Más canales de memoria

Rambus memoria HBM3

En la memoria HBM3, y sus antecesoras, los canales de memoria corresponden a la cantidad de chips que se pueden colocar cómo máximo en la pila. Aunque es posible asignar dos canales por chip de memoria. Por ejemplo en las dos primeras generaciones donde el bus era de 1024 bits se podían usar hasta 8 canales de memoria. Por lo que con un ancho de banda de 128 bits por cada uno de los 8 chips apilados, pero en general por motivos de costes se usaban 4 chips con dos canales de memoria para cada uno.

En la HBM3 la norma ha cambiado, ahora pasamos a tener 16 canales de memoria y dado que el bus máximo es de 1024 bits esto se traduce en que podemos llegar a una pila de 16 chips con un bus de 64 bits cada uno. No obstante, el estándar completa configuraciones de 12 chips y, por tanto, de 768 bits de ancho de banda. Otro elemento que vuelve desde la segunda generación de esta memoria es el de los pseudo canales, esta vez son 2 por canal, pudiendo llegar a 32 de ellos.

Todo ello se traduce en que el ancho de banda ira en la primera generación de la HBM3 de los 614,4 GB/s de las configuraciones de 12 chips por pila a los 819,2 GB/s para las de 16 chips por stack. No olvidemos que ya se suelen ver tarjetas gráficas HPC de 2, 4, 6 e incluso 8 chips de este tipo de memorias y esto en las HBM3 significan varios Terabytes por segundo por ancho de banda.

Mayor capacidad de almacenamiento

24 GB HBM 3

Ya para terminar tenemos la cantidad de memoria que se podrá albergar la memoria HBM3 y esta ira de los 8 Gb, 1 GB, a los 32 Gb, 4 GB, por cada chip en la pila. Si hacemos cálculos rápidos podremos ver que estamos hablando de configuraciones de 12 o 16 GB para la primera generación de esta memoria y progresivamente podríamos alcanzar los 48 o 64 GB. Recordad que estas capacidades son por chip de memoria. Por el momento tenemos a empresas como SK Hynix que ya ofrecen pilas de 12 chips con una capacidad total de 24 GB.

Dicho de otra manera no falta mucho para que veamos tarjetas gráficas con centenares de gigabytes de memoria RAM, al menos en el mundo de la computación de alto rendimiento. ¿Cuál será la primera afortunada? El timing nos dice que será la Hopper de NVIDIA que debería aparecer en algún punto avanzado en el tiempo de 2022 o en pleno 2023.

¡Sé el primero en comentar!