No solemos hablar de sistemas para servidores, sin embargo, el MI300 de AMD nos ha llamado la atención. No por su extraña configuración, sino por el hecho de que puede ser una pista de como pueden ser los sistemas con hardware de la marca en exclusiva de cara al futuro. Lo que incluiría no solo futuros PC, sino también potenciales consolas de videojuegos.
Los altos costes de fabricación y ciertos límites que antes no existían hacen que a la hora de diseñar nuevos procesadores se tengan que buscar soluciones alternativas a la hora de construir sistemas complejos. Una de las tendencias que más sonaba sobre el papel es el traslado de la intercomunicación interna de un chip a lo que llamamos interposer en un circuito integrado 2.5D, es decir, compuesto por varios chips de pequeño tamaño en vez de uno solo grande. El MI300 es el primer producto que cumple con dicha promesa y aunque es un procesador para servidores y, por tanto, computación de alto rendimiento, es interesante echarle un vistazo con visos a futuro.
AMD consigue memoria totalmente coherente en el MI300
Una de las particularidades que tienen las consolas de videojuegos es el hecho de que su espacio de memoria se encuentre totalmente unificado a nivel físico, es decir, todos los elementos comparten el acceso a los mismos chips de memoria RAM. Sin embargo, lo que se hace es separar el espacio de almacenamiento en dos mitades distintas para evitar conflictos en cuanto a la coherencia de memoria. No obstante, lo ideal sería que todo el espacio fuese compartido, ya que esto impediría el uso de procesos de copia de una parte de la RAM a otra.
Es decir, incluso teniendo la memoria físicamente compartida, es necesario usar la unidad DMA para copiar del espacio para la CPU al de la GPU y viceversa. La unificación en direccionamiento de ambos pozos de memoria es una de las cosas de las que la empresa de Lisa Su lleva hablando, y no es broma, desde hace una década. Sin embargo, lo venden como una de las mejoras a tener en cuenta en el MI300. En todo caso, una de las particularidades del estándar CXL, es la de otorgar esa capacidad al PCI Express, pero eso tiene un problema que os comentaremos más adelante.
¿Por qué esto es una pista del futuro?
Hasta ahora habíamos visto la implementación de un sistema de memoria totalmente coherente con un chip monolítico en el que CPU y GPU compartían el mismo controlador de memoria. Si nos fijamos, el MI300 está compuesto por varios chips con su controlador de memoria propio y aun así existe un mecanismo de coherencia completo. No es por el uso de la memoria HBM, sino por los cambios realizados por AMD en el controlador de memoria, especialmente de la GPU de este mastodonte para servidores.
Claro está, que la gracia se encuentra en el hecho donde se encuentra el controlador de memoria integrado y no es ninguno de los diferentes chiplets de CPU y GPU, sino en el interposer, y es que todos ellos están montados sobre otro chip mucho más grande, encargado de comunicarlos entre sí y con la memoria HBM. Ahora bien, si lo pensamos, dado que dicho interposer es una pieza aparte, entonces puede ser trasladado sin problemas a otro tipo de composición. ¿Qué tal a una futura consola de videojuegos?
La tendencia con la subida de costes es la de disgregar los chips en varios distintos, no es un capricho de AMD y se ha demostrado que ciertos componentes no escalan tan bien usando transistores más pequeños, de ahí a separar dichas funciones en chips separados fabricados con nodos más baratos. Además de lo mencionado, el Interposer del MI300 también incluye la llamada Infinity Cache como LLC, lo cual es clave para conseguir un sistema totalmente coherente.
¿Lo veremos en PC?
Una configuración UMA en un ordenador no sería imposible, sin embargo, esto significaría vender procesador, gráfica y la memoria RAM compartida en un mismo paquete y no parece que sea económicamente barato. En consola se utiliza memoria GDDR6 por la estructura de costes, pero en PC el uso de dicha memoria sería mortal, debido a tener una latencia mucho mayor que la RAM convencional. Es decir, empleando el mismo procesador se pierde rendimiento. ¿La DDR5? Incluso siendo más rápida que la DDR4, no tiene el suficiente ancho de banda para ser viable para una GPU integrada de alto calibre.
Por lo que al final lo único que les queda es la memoria HBM, extremadamente cara para ser colocada en un sistema doméstico. Por lo que haciendo cábalas solo nos quedan las consolas de videojuegos y una futura tarjeta gráfica Radeon, ¿quizás RDNA 4? En la que la función de los chiplets de pequeño en las RX 7000 tamaño se traslade al interposer, dando la posibilidad de disgregar el chip principal. En resumidas cuentas, lo que ha hecho AMD es mover el clásico Northbridge, lo que ellos llaman IOD en su jerga de marketing, al interposer.