NVIDIA responderá a Intel con una GPU dual, ¿miedo a Ponte Vecchio?

En las últimas semanas hemos visto aparecer noticias acerca del lanzamiento de dos GPU HPC de configuración MCM en dual, es decir, compuestas por dos chips en vez de uno. Estamos hablando de la AMD Instinct MI200 de AMD y el Intel Ponte Vecchio, lo que nos lleva a la pregunta: ¿acaso NVIDIA no está preparando una NVIDIA A100 Dual para hacer frente a Intel y AMD?

En estos momentos NVIDIA es la reina absoluta del mercado en tarjetas gráficas HPC, más que nada por la falta de competencia, pero la falta de oposición se ha acabado tan pronto como Intel y AMD han lanzado sus respuestas en forma de AMD Instinct MI200 e Intel Ponte Vecchio.

Ponte Vecchio

¿La particularidad? El hecho de que encima del Interposer no haya una sola GPU, sino dos de ellas. En el caso de Intel han utilizado las tecnologías EMIB y Foveros de los de azul, pero en el caso de AMD al ser una compañía Fabless han utilizado la tecnología CoWoS-S de TSMC en su última versión.

TSMC CoWoS hot Chips

Pues bien, la tecnologia CoWoS-S de TSMC también fue utilizada por NVIDIA para la creación de su GPU HPC A100, la cual recordemos que al contrario de las utilizadas en las GeForce Ampere ha sido fabricada en TSMC bajo el nodo de 7 nm de esta fundición.

¿Es posible que veamos una NVIDIA A100 Dual?

CoWoS 6th Gen

Mientras los rumores hablan del retorno de NVIDIA a TSMC bajo el nodo de 5 nm con la arquitectura Lovelace, la gran pregunta es si ellos tienen una respuesta a sus rivales en el mercado HPC que utilice el mismo empaquetado CoWoS-S que la AMD Intinct MI200.

La NVIDIA A100 es una GPU enorme con un área de 826 mm2, por lo que está en el límite de tamaño de la retícula que se puede utilizar para fabricar un chip, y por tanto NVIDIA no puede hacer una GPU más grande. Aunque si le hacemos una observación al diagrama del A100 veremos como la caché L2 está dividida en dos bloques. Esto es debido a que la A100 por si sola se puede ver como dos GPU integradas como una sola.

NVIDIA-GA100-GPU-Block-Diagram-Ampere

Si se utiliza la tecnología CoWoS-S de TSMC, entonces cada una de las GPU encima del interposer no puede superar los 600 mm2 de área si se utiliza una configuración dual, pero el total es superior a lo que se alcanza con un chip monolítico. Esto le permite a NVIDIA plantearse una futura GPU HPC con una mayor cantidad de transistores y una configuración no con 6 módulos HBM2e, sino con 8 módulos de la misma memoria.

No obstante el 2022 también es el año en que los chips de alto rendimiento fabricados bajo el nodo de 5 nm de TSMC aparecerán en el mercado, y con ello es posible que desde la compañía con el logo verde den un golpe de efecto con la presentación de una más que rumoreada y esperada arquitectura, lo cual descartaría la idea de una A100 Dual por parte de NVIDIA.

Pero entonce, ¿estamos hablando de la primera implementación de NVIDIA Hopper?

NVIDIA Hopper composición Grace

Obviamente NVIDIA hará cambios en sus núcleos shader, dentro de los conocidos SM. Muy probablemente veremos un nuevo tipo de Tensor Core y más ahora cuando Intel ha sacado pecho con una XMX que son el doble de rápidas que sus equivalentes actuales en NVIDIA. No sabemos si NVIDIA adoptará la unidad conmutada Int32/FP32 que tienen las GeForce Ampere, pero no la A100, en todo caso todos esos cambios serían suficientes para hablar de una nueva arquitectura.

Es más que posible que la A100 Dual de la que estamos hablando sea ni más ni menos que Hopper, ya que si es así entonces tendría sentido que se diese el retorno triunfante a TSMC bajo el nodo de 5 nm. Obviamente no podemos olvidar que el límite de los 600 mm2 de área continuará estando, pero con un nodo que tiene una densidad 1,8 veces superior que el utilizado en la actual A100.

Por lo que puede que NVIDIA tenga su golpe encima de la mesa para mantener el liderato en el mercado de las GPU para la computación de alto rendimiento e inteligencia artificial, seguramente no han estado de brazos cruzados a verlas venir.

1 Comentario