Fabrican el primer procesador con 400.000 núcleos y más de un billón de transistores
Terminada la conferencia de Hot Chips de este año 2019, podríamos decir que apenas ha habido sorpresas más allá de adelantar algunos avances en tecnologías ya vistas y explicadas. Pero no todo ha sido continuista, sino más bien al contrario, ya que la compañía Cerebras ha presentado el primer procesador del mundo con 400.000 núcleos y más de un billón de transistores, todo en un único y masivo die.
Cerebras Systems: el primer procesador supermasivo con un único die
Estamos acostumbrados a ver procesadores con uno o varios dies interconectados a través de una matriz en forma de PCB, pero lo que ha logrado Cerebras va más allá de un procesador corriente, quizás podríamos decir que va justamente en la dirección opuesta.
Y es que la maravilla que vamos a ver está fabricado a través de lo que ellos han denominado «Wafer Scale Engine«, lo que les ha permitido un diseño y fabricación de unas medidas monstruosas: 46,225 milímetros cuadrados. Esto supone un die que alberga 1,2 billones de transistores y la friolera de 400.000 núcleos de procesamiento, donde además el propio chip incluye 18 GB de memoria.
Para dar vida a este super procesador, se han necesitado 173 ingenieros y unos fondos de 112 millones de dólares, donde su diseño ha roto con lo convencional. Y es que, en vez de usar una oblea para construir múltiples chips, decidieron usar toda la oblea para crear un chip gigantesco.
esto permite que todos los núcleos se conecten entre sí directamente, reduciendo las latencias derivadas de tener que salir mediante un bus de interconexión por la matriz, a lo que, sumado sus GB de memoria, tenemos prácticamente un SoC a falta de iGPU en un solo y masivo die.
Un grabado de oblea distinto, nuevo software para ello y una precisión perfecta
Los desafíos a los que se ha enfrentado Cerebras han sido enormes, donde al mismo tiempo TSMC -la encargada del grabado de las obleas- ha tenido que poner toda la carne en el asador para tan titánica obra.
Y es que, desde el punto de vista de la construcción y grabado, la oblea tuvo que ser grabada con nuevas técnicas y software específicos para poder dar vida a los más de 1 billón de transistores.
Por si fuese poco, la fabricación de chips actuales fragmenta las obleas para maximizar el rendimiento de los chips, ya que se pueden descartar los que tengan fallos.
En este caso, la oblea y su proceso litográfico deben ser perfectos, así como su grabado, ya que hasta ahora en litografía el concepto de perfección no va vinculado a la realidad.
La solución fue simple: usar redundancia agregando núcleos adicionales en todo el chip a modo de respaldo por los posibles errores. Dejando esos núcleos adicionales lograron que el enrutado entre ellos se mantuviese, no perjudicando el rendimiento del chip y logrando que éste fuera de oblea completa.
El último paso a enfrentar por los chicos de Cerebras fue la expansión térmica. Este término se refiere al hecho de que distintos materiales se expanden con el calor de forma diferente, por lo que la conexión con una placa base necesita que sus materiales se expandan al mismo nivel y ritmo que los del procesador para no generar problemas de conexión.
Además, ayudaba a sobrellevar los 15 kilovatios de potencia que necesita. Para enfriar tal cantidad de energía se diseñó el chip para una entrega vertical, por lo que se aseguraba que todos los puntos del chip pudiesen ser enfriados correctamente.
Nuevo material para absorber la expansión térmica
Para solventarlo, tuvieron que crear un nuevo material (no especificado) que absorbiera la diferencia entre la placa base y el procesador. Para terminar, necesitaron crear un flujo de fabricación personalizado, puesto que la industria no trabaja con procesadores tan masivos, y es que así podrían comercializarlo y crear tendencia en dicha industria.
Ahora que el proyecto es una realidad, en Cerebras están suministrando muestras a modo de prototipos completos a los clientes, donde si efectivamente logra triunfar, el siguiente paso es la escalabilidad de la producción para satisfacer la demanda.
Veremos en unos meses cómo reaccionan los clientes ante tanta potencia compactada en un inmenso die.