Intel enseña su monstruosa GPU Arctic Sound Xe con 42 TFLOPs

Intel enseña su monstruosa GPU Arctic Sound Xe con 42 TFLOPs

Rodrigo Alonso

Seis meses después de los primeros rumores acerca de ello, Intel ha confirmado la existencia de una GPU Arctic Sound Xe totalmente monstruosa, basada en MCM con nada menos que cuatro capas que suman 16.384 núcleos para proporcionar un rendimiento bruto de 42 TFLOPs. Como ya supondréis, esta GPU estará orientada para el entorno empresarial, pero es un indicativo de lo que Intel está avanzando en el apartado de su arquitectura gráfica Xe.

Realmente, desde que Intel comenzó su andadura para tratar de potenciar su arquitectura gráfica ha llovido y se ha hablado bastante, pero con resultados bastante escasos. La compañía ha fichado a grandes estrellas de la industria como Raja Koduri de AMD, pero aunque la arquitectura gráfica Xe parecía prometedora por el momento los resultados han sido decepcionantes.

Por este motivo, seguramente, han decidido que en su último Architecture Day celebrado ayer, iban a mostrar todo el potencial que su nueva arquitectura era capaz de desarrollar. En éste, han enseñado una GPU llamada Arctic Sound como ya se sabía, pero lo que no se sabía era que se iba a tratar de una monstruosidad capaz de generar 42 TFLOPs de potencia bruta en cálculos FP32.

Intel Arctic Sound Xe, diseño MCM con 16.384 núcleos

Por el momento esta monstruosa GPU solo está en los laboratorios de la compañía, pero han decidido que ya está lista para que puedan presumir de ella, o al menos de su potencial. Esta GPU tiene diseño MCM en mosaico de 2×2, y en total integra 2.048 EUs; dado que cada EU equivale más o menos a 8 núcleos, esta GPU tiene 16.384 núcleos en total, a una velocidad de funcionamiento de 1,3 GHz que rompe todas las escalas de potencia bruta de cómputo, alcanzando los 42 TFLOPs en cálculos FP32.

Intel Arctic Sound MCM Mosaico

Raja Koduri ha confirmado además que están trabajando en versiones con una sola pieza y también con dos, como se puede ver en la imagen de arriba. La GPU de una pieza tendría 512 EU (4.096 núcleos) y la de dos piezas 1024 EUs (8.192 núcleos), mientras que la de 4 piezas como ya hemos dicho tendría 2048 EUs (16.384 núcleos), todos ellos basados en la arquitectura HP.

Si bien los controladores y las revisiones del chip están todavía «en pañales» porque hace poco que han podido crear las primeras muestras de ingeniería funcionales de estas GPUs Arctic Sound, ya han podido mostrar algunos benchmarks que sirven como puntos de referencia. Una de estas GPUs de una sola pieza (tile) es capaz de transcodificar 10 transmisiones separadas de contenido 4K a 60 FPS en formato HVEC, lo cual resulta toda una hazaña. Dado que el escalado que está usando Intel es prácticamente lineal, la GPU de 4 piezas de mosaico debería ser capaz de transcodificar hasta 40 secuencias simultáneamente.

Escalado Intel Xe-HP

Desafortunadamente para los gamers, esta GPU en particular está diseñada para centros de datos y entornos profesionales, así que no llegará al mercado de consumidor. No obstante y como siempre decimos, esto sirve para darnos una muestra de lo que la GPU es capaz de hacer, y al final siempre utilizan estas tecnologías para terminar en el mercado de consumidor, así que estamos seguros de que Intel está trabajando ya en una variante gaming para lanzar al mercado y competir con AMD y NVIDIA.

Pruebas de rendimiento

Por supuesto, durante la conferencia virtual han mostrado datos concretos de rendimiento en algunos benchmarks, los cuales os vamos a mostrar a continuación. Para empezar, la transcodificación de vídeo de la que hemos hablado antes.

Y para terminar, la «prueba» de esos 42 TFLOPs de rendimiento bruto de los que hablábamos al principio. También se puede ver el rendimiento bruto FP32 de las versiones de 1 y 2 tiles de la GPU y el escalado casi perfecto de estos mosaicos, de 1,999X en el de 2 tiles y de 3,993X en el de 4.

Rendimiento Intel Xe-HP

Desde luego la cosa pinta bien. Si miramos la posibilidad de extrapolar esto al mercado de consumidor, parece evidente que se utilizaría la GPU Arctic Sound de 1 tile, la cual muestra 10,5 TFLOPs de potencia bruta y eso, como hemos dicho antes, con unos drivers que todavía están en pañales, así que tiene muchísimo potencial para mejorar.