La GPU multi chip de AMD: 4 veces más rápida y con 128 GB de VRAM

Cuando NVIDIA habló por primera vez de las GPU basadas en chiplets pensábamos que iban a ser los de Jensen Huang los que se adelantarían con el primer diseño en el mercado, pero mientras Hopper no es más que una promesa en un papel, el equipo rojo ya tiene su primera GPU de este tipo, la AMD Instinct MI250X, de la que ahora conocemos sus especificaciones.

Antes de nada, hay que volver a aclarar que llamar a las AMD Instinct bajo el nombre de GPU, Graphics Processor Unit, es cuanto menos una contradicción, ya que pese a derivar de este tipo de procesadores en arquitectura los de Lisa Su les han quitado todas las unidades de función fija, la capacidad de procesar listas de comandos gráficos en el procesador de ídem y carecen también de controlador de pantalla. En pocas palabras, no sirve para renderizar gráficos, pero sí para realizar cálculos en paralelo a una gran velocidad.

AMD Instinct MI200 MI250 MI250X

¿El objetivo de AMD con estas tarjetas? Competir contra las actuales NVIDIA A100 y contra Ponte Vecchio en el mercado de GPU HPC, el cual por parte de las dos marcas que también hace CPU x86 está en las GPU MCM.

Así sería la AMD MI250X

La información nos llega a través del insider ExecutableFix que a través de una serie de Tweets ha ido dejando información sobre las AMD Intinct MI200 y nuestra primera sorpresa es que el nombre no es el que nos esperábamos, ya que estas aparecerán en dos modelos y bajo el nombre de AMD Intinct MI250 y MI250X, por lo que se pierde el nombre de MI200.

En primer lugar, hemos de tener en cuenta que esta GPU de AMD es un módulo MCM que une 2 procesadores gráficos bajo un mismo interposer, por lo que estamos hablando realmente de 220 Compute Units, lo cual teniendo en cuenta la velocidad de Boost 1,7 GHz da como resultado un 13% más de frecuencia si la comparamos con la del MI100.

En cuanto a la potencia de cálculo de la AMD Instinct MI250X, esta es de 47,9 TFLOPS en coma flotante de 32 bits, pero lo que realmente importa en este tipo de GPU es la computación en FP64 donde deberíamos esperar el mismo rendimiento (o al menos similar). Por lo que AMD habría dejado de utilizar el SIMD sobre registro. Lo cual, combinado con el uso de una GPU Dual le dan una potencia cuatro veces superior respecto al AMD Instinct MI100.

En cuanto a la potencia de 384 TFLOPS FP16/BF16 hace referencia a las Matrix Core Units, el equivalente a los Tensor Cores de NVIDIA, el ratio en potencia entre las ALU FP32 en las unidades SIMD y las unidades tensoriales de la Compute Unit es el mismo que en las GPU de NVIDIA, por lo que se puede decir que AMD ya tiene una GPU para hacerle frente a los de Huang a la hora de acelerar algoritmos de IA y no solo para HPC.

No la verás en tu PC

Intel-Nervana-NNP-L-1000-OAM-Cover

El hecho de que el consumo energético para la GPU al completo sea de 500W, nos da una pista de que no se trata de una tarjeta gráfica para un PC estándar. Bien es cierto que la interfaz PCI Express 5.0 permite llegar a los 600 W de consumo, todo apunta a que esta es la GPU que integrará uno de los superordenadores con los que AMD tenía contrato para su desarrollo, por lo que podrían ser montadas en un módulo OAM, muy similar al de la imagen de arriba.

CoWoS Roadmap

No podemos olvidar además que la GPU al usar memoria HBM2E y una configuración de GPU Dual se va a ver de manera muy similar a la foto de encima de estas líneas, con su memoria RAM y las dos GPU encima de un interposer CoWoS-S de TSMC. Todo ello tiene un coste de fabricación que hacen prohibitivos estos circuitos integrados para el mercado doméstico. En todo caso la AMD Instinct MI250X no puede generar gráficos de ningún tipo, por lo que los PC domésticos no son su sector lógicamente.

No obstante no debemos descartar una versión PCIe de las AMD Instinct MI250X y MI250, ya que es el factor forma de las actuales MI100, pero todo apunta que la versión para el superordenador El Capitán será OAM y seguramente allí podrán ser vistas por primera vez.