El monstruo que prepara NVIDIA: ¿Lovelace será la GPU más grande de la historia?

Hace poco menos de una semanas que supimos la posible existencia de la GPU con el nombre clave Lovelace, la cual recordemos que no ha sido todavía confirmada por NVIDIA, pero eso no impide a los pozos de rumores y mentideros de la red empezar a sacar posibles especificaciones técnicas de la siguiente gran arquitectura de NVIDIA, la que deberíamos conocer como las RTX 4000.

Antes de nada tomaros esto con un gran escepticismo, pese a que el filtrador de la información acertó en su día acerca de las especificaciones de las RTX 3000 y la NVIDIA A100, también es posible que él haya recibido contra-información por parte de NVIDIA con tal de proteger los planes especificaciones de la siguiente generación de las NVIDIA GeForce, en todo caso nosotros os informamos sobre ellas y os comentamos los posibles cambios que NVIDIA podría hacer para llegar a ellas.

Ada Lovelace

Recordad que según los rumores, Lovelace es la siguiente arquitectura de NVIDIA, la cual será lanzada a partir de 2022 como fecha más temprana y bajo un nodo de 5 nm, del cual no sabemos si será de TSMC o de Samsung pero todo apunta a la primera. En todo caso sed escepticos hasta en estos porque nadie esperaba a las RTX 3000 en el nodo de 8 nm de Samsung.

El posible espectacular salto de NVIDIA de Ampere a Lovelace

Rumor Lopite Specs Lovelace

Según el insider Kopite7kimi en su twitter, el chip AD102 bajo la arquitectura GeForce Lovelace va a tener una estructura 12*6 en vez de una 7*6 como la GA102, si esto de entrada os suena a chino es fácil explicarlo haciendo uso del diagrama de la GA102, la GPU utilizada en las RTX 3080 a las RTX 3090 y todas las variantes entre ambas.

NVIDIA-Ampere-GA102

La GA102 de NVIDIa tiene 7 GPCs, cada GPC tiene 6 unidades que son llamadas TPC y cada una de ellas engloban 2 SMs. ¿A que se refiere Kopite en su información? Pues que vamos a tener un total de 12 GPCs con 6 TPC cada uno. Lo cual vendría a ser una indicación de como NVIDIA para la siguiente generación buscaría colocar la mayor cantidad de unidades en el área del chip. pero hay elementos que nos hacen ser escépticos.

El motivo principal es que NVIDIA no suele buscar la mayor cantidad de elmentos posibles en la CPU, sino que lo que busca es aumentar la capacidad de cada uno de ellos. En estos momentos están bajo el mapa de ruta para alcanzar el soporte completo para el Ray Tracing y pese a la potencia de las RTX 3000, todavía no hemos visto soporte para cosas como la coherencia en el Ray Tracing e incluso unidades de aceleración de las estructuras de datos.

NVIDIA Lovelace va a necesitar una nueva estructura de interconexión

Interconexiones

Los specs de Kopite nos indican una mejora muy grande en las interconexiones que comunican los diferentes GPCs y los elementos a los que están conectados como la cache L2, ya que uno de los motivos por los cuales no se aumenta indiscriminadamente la cantidad de núcleos de un procesador es por la cantidad de energía que requiere aumentar la cantidad de interconexiones, por lo que se prefieren menos núcleos pero más potentes.

No sabemos si NVIDIA ha conseguido de alguna manera que la interconexión que une los diferentes GPC con la Cache L2 y estos entre si les permite un espectacular salto que coloque la configuración de esta GPU de los 84 SM a los 144 SM en una generación, sería el salto más grande de todos los que jamás habría hecho NVIDIA en este aspecto.

RTX 3000 Mobility

La otra posibilidad es que el nodo de 5 nm no permite aumentos de la velocidad de reloj tan grandes como lo que se espera y esto haga que sea necesario aumentar la cantidad de unidades SM en la GPU, pero para ello es necesario por parte de NVIDIA rehacer toda la estructura de interconexión de dentro de la GPU y superar los handicaps que tienen en cuanto a consumo energético en estos momentos a la hora de transmitir datos dentro de un procesador.

En todo caso somos escépticos, podemos creer que NVIDIA haga cambios profundos en los SM y hay una lista de cosas que podría llegar a hacer, pero el aumento en la cantidad de SMs nos parece a día de hoy un salto demasiado exagerado sin que haya cambios en el resto de la GPU.

NVIDIA Lovelace, ¿no tan monolítico?

NVIDIA GRS

Hace un año NVIDIA presento un chip experimental llamado RC-18, del que lo que especialmente destaco el llamado GRS o Ground Reference Signaling, un tipo de interconexión en vertical que NVIDIA utilizo para comunica varios chiplets dentro de un MCM.

La idea es que cada chip tenga 4 canales de comunicación completos (Norte, Este, Sur, Oeste) y el emisor y receptor de cada canal, por lo que estaríamos hablando de una configuración del tipo NoC en el que cada elemento puede comunicarse de manera directa con los 4 que tiene a  su alrededor.

En el ejemplo de NVIDIA se utilizaban varios chiplets, pero esto no significa que no sea posible hacerlo con una GPU aparentemente monolítica,  ya que los GRS se comunican a través de un Interposer que hay debajo, por lo que en apariencia el chip parecería uno monolítico pero sería una composición 3DIC en el que la estructura de intercomunicación estaría en un chip colocado a la parte inferior.

VRAM más allá de la GDDR6X

FGDRAM-Power-Consumption

Lo que tampoco nos podemos olvidar de estas especificaciones es que este monstruo de GPU va a requerir un tipo de memoria VRAM con un gran ancho de banda con tal de poderla alimentar a una velocidad constante, e incluso la GDDR6X no la vemos alimentando a un monstruo de semejantes características. ¿Vamos a ver NVIDIA desplegar su memoria FG-DRAM por primera vez en el mercado con esta GPU?

El problema de la FG-DRAM es que se trata de un tipo de memoria pensada para funcionar como la HBM por lo que sería muy cara, otra posibilidad sería que al igual que con el RTX IO se soporta descompresión de datos al vuelo también se haga con la RAM, pero estamos hablando de anchos de banda 50 veces más rápidos y puede que no se llegue a semejante velocidad de descompresión a tiempo real.

Es por ello que NVIDIA Lovelace podría venir con nuevo tipo de memoria VRAM, sea la FG-DRAM u otro tipo no lo creemos pero la GDDR6X se queda corta ante semejante monstruo si es que las especificaciones técnicas que se han filtrado son ciertas.