Seguramente alguna vez te has dado cabezazos por que tu ordenador no funciona como es debido, algo falla. En un ordenador portátil o de sobremesa, encontrar el problema y solucionarlo es sencillo. Ahora bien, el ordenador más potente del mundo, que tiene el nombre de Frontier, tiene problemas de rendimiento, y si bien saben cuál es el problema, aún no lo han podido arreglar.
Frontier es un superordenador desarrollado para realizar trabajos avanzados que requieren gran potente de cómputo. Una de sus principales características es la capacidad de ofrecer una potencia superior al 1 ExaFLOP. Hablamos de una potencia del orden de miles de veces superior a la de un ordenador doméstico.
El ordenador más grande y caro del mundo se cuelga todo el rato
Actualmente este superordenador está funcionando, aunque debido a su capacidad de cómputo, no funciona bien. Hacer que un sistema así de bestia funcione debidamente es realmente complicado. Debemos tener en cuenta que tiene miles de componentes y un sistema de interconexión muy complejo. No es como un ordenador doméstico, que es fácil de montar y de reparar.
Para que nos hagamos una idea, Frontier cuenta con 9472 procesadores AMD EPYC 7A53s. Cada uno de estos procesadores tienen un total de 64 núcleos y trabaja a una frecuencia de 2.0 GHz. Se complementa con un total de 37.888 tarjetas de aceleración Radeon Instinct MI250X.
Cada uno de los nodos está conformado por una CPU AMD, cuatro tarjetas gráficas AMD cada una con 128 GiB de memoria HBN2e y 512 GiB de memoria RAM DDR4. Además, cada uno de los sistemas cuenta con una capacidad de almacenamiento de 4 TB NVMe.
Según parece, este sistema presenta un fuerte problema de funcionamiento que tiene que ver con las Insctinc MI250X. El sistema de interconexión Slingshot utilizado para este sistema estaría generando problemas de funcionamiento con grandes cargas.
Justion Whitt, Director del Programa Oak Ridge Leadership Computing Facility ha explicado:
En su mayoría, se trata de problemas de escala junto con la amplitud de las aplicaciones, por lo que los problemas que encontramos se relacionan principalmente con la ejecución de trabajos muy, muy grandes usando todo el sistema… y hacer que todo el hardware funcione en concierto para hacer eso
Pero no sería el único problema que estaría afectando al rendimiento. Indica que los productos de AMD no serían el problema, sino que sería una «casualidad». Destaca también que este tipo de problemas de rendimiento no son algo inusual en este tipo de sistemas. Cuando se crean sistemas de este tipo, hasta que todo funciona debidamente, suele pasar tiempo y requiere de corregir diferentes problemas.
Equipos costosos y difíciles de ensamblar
Debemos tener en cuenta que este tipo de sistemas hay miles de conexiones existentes. Hacer que todo el sistema funcione de manera correcta no es nada sencillo, hay que realizar muchos ajustes. Además, también hay que tener en cuenta que muchas aplicaciones no están listas para este tipo de sistemas.
Uno podría pensar que, al no funcionar correctamente, sería mejor crear varios sistemas. La realidad es que es más «sencillo» ajustar el software que crear varios sistemas más pequeños. Muchas veces los datos obtenidos se necesitan para el siguiente paso en el procesamiento.
Tenemos que decir que este tipo de equipos se utilizan para estudios científicos complejos como la astrofísica o biomedicina. También se utilizan para predicciones climáticas y múltiples tipos de simulaciones avanzadas. Cosas que un ordenador normal o un conjunto de los mismos tardarían años en realizar, pero que un superordenador puede realizar en muchísimo menos tiempo.