Con la filtración de los datos de NVIDIA en el robo de datos para sus servidores no solo ha salido a la luz del mundo su roadmap en cuento a arquitecturas gráficas, sino también la configuración de las GPU RTX 40 basadas en la arquitectura Ada Lovelace que NVIDIA lanzará en algún punto de este 2022. ¿Cómo se comparan con la generación actual?
Las malas lenguas afirman desde hace tiempo que la arquitectura Ada Lovelace de las RTX 40 inicialmente era conocida cómo Ampere 2.0 y sería un movimiento muy similar la que hizo NVIDIA con las GTX 900 y las GTX 1000, donde trasladaron la arquitectura Maxwell de los 28 nm Bulk a los 16 nm FinFET, añadieron algunas mejoras menores y una mayor cantidad de núcleos en el proceso. En el caso que nos ocupa sería el traslado del nodo de 8 nm de Samsung al de 5 nm de TSMC.
Configuración de las GPU NVIDIA RTX 40
Resulta que se ha filtrado información sobre la cantidad de SM, que es como NVIDIA llama a sus unidades Shader o núcleos reales de la GPU, que tienen las diferentes configuraciones de la arquitectura Ada Lovelace. No olvidemos que NVIDIA también llama núcleos CUDA a las unidades FP32 dentro de los SM.
La información de manera resumida queda de la siguiente manera:
- El chip AD102 tiene un total de 144 SM (18.432 núcleos CUDA), lo cual es un salto importante respecto a los 84 SM de la RTX 3090 Ti.
- En el segundo lugar tenemos AD103 con 84 SM (10.752 núcleos CUDA), justo la misma cifra que el actual GA102 de las RTX 30. Por lo que deducimos que se trata de una conversión de dicho chip a los 5 nm de TSMC.
- En el caso del AD104 tenemos una configuración de 60 SM (7.680 núcleos CUDA), 12 más que la actual GA104.
- AD106 tiene una configuración de 36 SM (4.608 núcleos CUDA). La actual GA106 tiene una configuración de 30.
- El chip más modesto sería el AD107 con 24 SM (307 núcleos CUDA). Por lo que en la parte más baja de la tabla también hay mejoras con 4 SM adicionales más.
¿Cómo interpretamos los datos?
No olvidemos que en las GPU de NVIDIA son una especie de Matroska en la que 2 SM forman parte de un TPC.
Y hasta 6 TPC forman parte de lo que llamamos un GPC.
Si los arquitectos que trabajan para Jensen Huang han mantenido las estructuras de sus dos generaciones anteriores en la RTX 40, lo cual no sabemos, entonces las configuración de las RTX 40 respecto al número de GPC que tendremos serian las siguientes en orden ascendente de potencia:
- AD107 o RTX 4050: 2 GPC y un potencial bus de 128 bits GDDR6.
- AD106 o RTX 4060: 3 GPC y un potencial bus de 192 bits GDDR6.
- AD104 o RTX 4070: 5 GPC y un potencial bus de 256 bits GDDR6.
- AD103 o RTX 4080: 7 GPC y un potencial bus de 320 bits o de 384 bits GDDR6 a alta velocidad.
- AD102 o RTX 4090: 12 GPC y un potencial bus de 384 bits o 512 bits de GDDR6 a muy alta velocidad.
¿Adiós a la GDDR6X en la siguiente generación de NVIDIA?
No hace mucho que los fabricantes de memoria RAM presentaron sus GDDR6 a 20 y 24 Gbps, lo que las coloca con el mismo ancho de banda que las GDDR6X. Eso sí, con un aumento de consumo considerable en el proceso por la subida de voltaje para alcanzar las trasferencias de 20 Gbps y 24 Gbps pero ganando la capacidad de tener chips de 2 GB en capacidad.
No sabemos si NVIDIA llegará a utilizar el conector de 600 W, pero sí que podemos tener por seguro que hará uso del de 450 W, ya que ya lo ha utilizado en su RTX 3090 Ti. La configuración de 12 GPC con 144 SM en su interior requiere un enorme ancho de banda, pese a que una configuración de 384 bits es la que tiene más números, desde aquí os adelantamos que no descartéis con el aumento de los márgenes de consumo por el nuevo conector una configuración para la RTX 40 más potente de 512 bits.