Desmitificando el M1 Ultra de Apple: ¿por qué es una APU Dual?

Apple ha presentado un nuevo Macintosh, el cual se podría haber llamado en concepto Mac Mini Pro, pero que al final han bautizado como Mac Studio. A simple vista se trata de un Mini PC, pero con las capacidades de una estación de trabajo. ¿Su particularidad? Apple ha introducido un nuevo procesador propio en el tope de gama de este ordenador: el Apple M1 Ultra. ¿Cómo es?

Llevamos tiempo oyendo como la ISA ARM puede ser competitiva frente a los x86 de PC, pero mientras en el resto de fabricantes esto es una promesa a futuro, en Apple ya es una realidad y es que sus núcleos de alto rendimiento tienen la capacidad de intercambiar golpes con las arquitecturas más avanzadas de Intel y AMD. Especialmente por el hecho que explotan un decodificador mucho más ancho en la unidad de control, aprovechando para ello la ventaja de las instrucciones de tamaño fijo de los conjuntos de instrucciones del tipo RISC.

Aunque especialmente está el hecho de que nadie en el mercado de los dispositivos PostPC se atreve a pasar de ciertos tamaños y consumos por los productos a los que van dirigidos. En cambio, los de Cupertino tienen una integración vertical completa en forma de un ecosistema basado en un sistema operativo propio. Si bien la propia ARM, NVIDIA, Qualcomm y muchas otras tienen la capacidad de desarrollar algo como lo que hace Apple, carecen de algo comparado al macOS que les permite crear un producto para dichos procesadores.

El M1 Ultra es el procesador más potente de Apple

M1 Ultra Especificaciones Generales

Hace unos meses los de Tim Cook nos mostraban el M1 Max, un SoC basado en la misma arquitectura que el M1 pero con una gran cantidad de núcleos de CPU, una GPU mucho más ancha y mayor cantidad de controladores de memoria. Una bestia de 423 mm2 de área bajo el carísimo nodo N5 de TSMC, y, por tanto, algo que nadie se atrevería a hacer para una tablet o un móvil por su gran tamaño. Entre sus bondades se encontraba una CPU de 10 núcleos de donde 2 son de eficiencia y 8 de rendimiento, una GPU de 32 núcleos o unidades shader del tipo Tile Rendering y un controlador de memoria de 512 bits LPDDR5.

Pues bien, el M1 Ultra duplica dichas especificaciones. Por lo que estamos hablando de 20 núcleos de CPU con 4 de eficiencia y 16 de rendimiento, una GPU de 64 núcleos para un total de 8192 ALU y un controlador de memoria de 1024 bits LPDDR5 con 128 GB de memoria soldada a placa y 800 GB/s de ancho de banda. El problema es que en este caso no estamos hablando de un SoC, sino dos de ellos que funcionan en tándem y han sido montados sobre un mismo interposer y es que a estos niveles de complejidad no es posible conectar de otra manera procesadores tan complejos en cuanto a la enorme cantidad de núcleos que tienen.

¿Cuál es su rendimiento?

Según el marketing de Apple el rendimiento por vatio es diez veces mayor que un PC Intel Core i9-12900K, pero hemos de tener en cuenta que este tipo de comparativas tienen trampa, ya que Apple no ha mencionado las condiciones y sujetos de la comparación. También afirma que el poder combinado de ambas GPU es equivalente o incluso mayor que una RTX 3090. Simplemente teniendo en cuenta las diferencias en arquitectura está claro que esto es una enorme exageración de Apple. Puesto que carece de integración de tecnologías DirectX 12 Ultimate, incluyendo el Ray Tracing, y de los potentes núcleos tensoriales. No obstante, su gran ventaja es que consume 200 W menos que la RTX 3090.

Aunque, siendo sinceros, ¿Quién va a jugar con un Mac existiendo el PC donde sí que hay juegos? Más bien estamos ante un procesador que busca para una cómo estación de trabajo, ya que es PC en el que va montado, el Mac Studio, es el reemplazo al hace tiempo desaparecido iMac Pro, eso sí, mucho más caro al necesitar esta vez de una pantalla externa.

¿Se trata de una innovación de Apple?

TSMC SoiC-I

No, más bien no, por el hecho de que los de Cupertino no fabrican procesadores y dependen de las tecnologías de TSMC para intercomunicar sus dos SoC. Lo que está claro es que se ha llegado al punto en que fabricar chips muy grandes ya no sale rentable, es más, en especificaciones un teórico Apple M1 Ultra monolítico superaría el límite de tamaño de lo que TSMC podría fabricar. Sumadle a esto que a medida que se aumenta el tamaño el porcentaje de encontrar fallos que hagan descartar el chip aumenta y ya tenemos la explicación a la necesidad de dividir de usar un SoC dual como procesador.

Si separas una CPU con pocos núcleos no ocurre nada, los anchos de banda utilizados son pequeños y esto es lo que ha hecho AMD con sus Ryzen por ejemplo. Pero cuando hablamos de GPU de alto calibre o CPU para servidores con decenas de núcleos que mueven gran cantidad de datos hacen faltas nuevas estructuras como Intel Foveros o TSMC SoIC. Precisamente es la tecnología de los taiwaneses la que permiten diseños como este Apple M1 Ultra y todo por el hecho que permiten reducir el enorme consumo que resulta la transferencia de datos a grandes distancias.

¿La clave? Conectar verticalmente cada uno de los dos M1 Max con el interposer sobre el que están conectados y luego hacer uso de un puente de silicio para la comunicación mutua. Lo que permite interconexiones más cortas, y poder colocarlas en gran número, en total más de 10.000. Donde cada una de ellas tiene baja velocidad de reloj y voltaje. Lo que permite una comunicación de 2.5 TB/s entre ambos SoC que componen el Apple M1 Ultra sin disparar el consumo. Este tipo de estructuras serán comunes para la comunicación entre los diferentes chiplets en diseños futuros de la industria.

¡Sé el primero en comentar!