FG-DRAM, el arma secreta de NVIDIA para reemplazar a la HBM2

FG-DRAM, el arma secreta de NVIDIA para reemplazar a la HBM2

Josep Roca

La FG-DRAM es uno de los desarrollos que NVIDIA tiene en la recamara en el futuro, se trata de un nuevo tipo de memoria que viene a reemplazar a la HBM2 como memoria para la computación de alto rendimiento. ¿Veremos este tipo de memoria RAM en la NVIDIA Tesla con chipset NVIDIA Hooper? No lo sabemos, pero por el momento os hacemos una pequeña introducción.

Habitualmente la forma en la que se ha ido evolucionando la memoria RAM convencional ha sido a base de aprovechar los nuevos nodos de fabricación para sacar memoria más rápida, en ancho de banda, bajo el mismo nivel de consumo, pero con resultados bastante leves.

Para explicaros cual es el problema de la evolución de la RAM respecto a su rendimiento, ancho de banda, imaginad que tenemos una interfaz que transmite 1 GB/s, la cual tiene unos 64 pines y la queremos ampliar para que soporte 2 GB /s, para ellos tenemos dos opciones:

  • Duplicar la velocidad de reloj.
  • Duplicar la cantidad de pines.

Subir la velocidad de reloj tiene el problema que el consumo aumenta exponencialmente con la velocidad de reloj y el voltaje y lo peor es que para llegar a ciertas velocidades de reloj el voltaje ha de subir, por lo que el aumento del consumo no sería de 4 veces más alto, sino incluso más por lo que nos podemos quedar sin energía suficiente para alimentar a la memoria.

La otra opción es aumentar la cantidad de pines, esto hace que sea necesaria cada vez menos velocidad de reloj, con ello se disminuye el voltaje y el consumo energético decrece. Pero el problema que esto conlleva es que es ampliar el perímetro del chip, por lo que aumenta su coste, por lo que mientras tiene una mejor solución de cara al consumo no lo es mejor en cuanto al coste.

HBM Interposer Render

Pero la solución a este dilema vino a través de las vías a través de silicio, para conectar las interfaces de memoria verticalmente sobre el interposer en el que estaba conectado tanto el procesador como la memoria, con ello había nacido la memoria HBM, la cual permitía enormes anchos de banda, pero con un consumo energético mucho más bajo.

Pero el tiempo pasa y la memoria HBM se está quedando corta en cuanto a sus capacidades ya que es necesario un nuevo tipo de memoria con un consumo energético mucho menor. Es por eso que las miradas están puestas hacía otro tipo de memorias como la Fine Grained DRAM.

¿Qué es la FG-DRAM?

FG-DRAM

En el 2017 NVIDIA realizo una presentación para hablar de un tipo de DRAM llamada FG-DRAM o Fine Grained DRAM como propuesta de reemplazo a la HBM2, la cual lleva siendo utilizada en las tarjetas NVIDIA Tesla desde el Tesla P100

La FG-DRAM al igual que la HBM2 es una memoria del tipo 2.5DIC con el procesador (o procesadores) encima de un inteposer junto a las pilas de la memoria. ¿Su punto fuerte? Tiene la particularidad de pasar de los 3.9 Pj/bit de la memoria HBM2 a 2 Pj/bit, por lo que puede ofrecer el doble de ancho de banda bajo el mismo consumo que la HBM2.

De la HBM2 a la FG-DRAM

FG-DRAM vs HBM2Una forma de hacer evolucionar la HBM2 es simplemente aceptar configuraciones con un mayor ancho de banda, a través de colocar un mayor número de chips en la pila, el problema es que a medida que vamos colocando más y más chips entonces las probabilidades de que toda la pila salga mal se disparan, este es el motivo por el cual no vemos memoria HBM2 con más de 4 chips de memoria por pila.

Pero la Fine Grained DRAM toma un camino distinto a la que se ha propuesto con la HBM 3 con tal de obtener una pila con un ancho de banda de 1 TB/s. Para ello, la idea es es aumentar la cantidad de bancos en cada chip de memoria, hasta un total de 512 bancos simultáneos, a los que se puede accede a una velocidad de 2 GB /s cada uno.

FGDRAM-Power-Consumption

Gracias a ello. se puede acceder a la pila de memoria FG-DRAM a 1 TB/ por el doble de consumo energético que la HBM2 a 256 GB/s. Pero dado que se obtiene un ancho de banda cuatro veces superior, esto significa que el consumo por bit transmitido se reduce a la mitad.