NVIDIA enfoca aún más su futuro en la IA y sus CPU ARM

NVIDIA enfoca aún más su futuro en la IA y sus CPU ARM

Josep Roca

En la presentación ofrecida por Jen-sen Huang, el ya veterano CEO de NVIDIA, para la GTC 2021. Hemos podido ver una NVIDIA totalmente centrada en la inteligencia artificial, y es que NVIDIA ha dejado ser una empresa que fabrica procesadores gráficos a ser una empresa que fabrica procesadores para la IA que se pueden utilizar para gráfico.

Durante una larga conferencia de dos horas, NVIDIA ha estado presentando sus apuestas para la IA y en especial para los centros de datos. Lo que ha tenido más peso en esta presentación no solo han sido los productos para la IA, sino la implementación de las DPU de Mellanox al porfolio de la compañía y una gran cantidad de software basado en la IA por parte de la compañía para diversas aplicaciones distintas como el transporte, la medicina, la manufacturación. En general ha sido una presentación que coloca el futuro de NVIDIA no en el gaming de PC, sino en todo el mundo de la IA y el Big Data y donde el PC solo es una pequeña parte de todo el ecosistema.

NVIDIA define Omniverse en la GTC 2021

NVIDIA Omniverse GTC 2021

Hace unos años aparecieron simuladores de realidad como Second Life, los cuales eran sumamente rudimentarios para los que se puede crear hoy en día, también podemos hablar de juegos como Minecraft que pese a sus juegos tienen una gran capacidad de simulación de mundos virtuales.

Imaginad por un momento una simulación de ese tipo corriendo en decenas e incluso cientos de GPUs con la capacidad de actuar como un gemelo del mundo real y simular la interacción ente los objetos, simulando desde los sistemas más simples a los complejos. Imaginad por ejemplo simular un coche no como una pieza sino como un sistema compuesto por sus diferentes piezas, las cuales interaccionan entre sí para crear el sistema complejo que es el coche en si mismo.

NVIDIA Omniverse GTC 2021

¿La utilidad de Omniverse? La idea es utilizar la simulación para crear entornos en los que las IAs basadas en visión por computación puedan ser entrenadas a través de entornos virtuales. Lo cual es ideal por ejemplo para crear modelos de inteligencia artificial para la conducción automática.

La enorme potencia combinada de tener a decenas e incluso centenares de GPUs permite la creación de entornos virtuales ultrarealistas para Omniverse, los cuales pueden ser utilizados para la producción de contenido audiovisual como anuncios sin tener que estar en el lugar e incluso poder hacer variaciones del mismo a través de simulación avanzada.

NVIDIA Bluefield

Blufield GTC 2021

La compra de Mellanox ha llevado a las DPU, Data Processing Units, al portfolio de NVIDIA. Estos no son más que SmartNICs y por tanto controladores de red avanzados. ¿Su trabajo? Liberar a la CPU y a las GPUs de las complejas tareas del transporte de datos  y de acceso a memoria para que sean realizadas en este tipo de procesadores especializados.

Donde primero NVIDIA ha desplegado los procesadores Bluefield ha sido en su servicio en la nube, GeForce Now, esto les permite descargar ciertas tareas de la CPU y la GPU en la DPU BlueField con tal de disminuir la latencia de su servició de Cloud Gaming. NVIDIA tiene planes bastante ambiciosos para su gama de DPUs, ya que pretende integrarlos junto a una CPU ARM basada en los núcleos A78. Curiosamente los mismos que los que utiliza el futuro Tegra Orin para 2023 y más adelante integrar todo el paquete completo con una GPU.

NVIDIA ATLAN

En este GTC 2021 NVIDIA no ha mostrado nada de Bluefield 4, pero si que ha hablado al final de un nuevo NVIDIA Tegra llamado Atlan, no hay que ser muy inteligente viendo como las gamas Blufield y Tegra terminarán integradas en una sola a partir de 2024. Viendo la descripción que NVIDIA ha dado del Tegra Atlan, esta claro que Bluefield 4 y Atlan son el mismo SoC o uno es una variante del otro.

NVIDIA renueva sus DGX y su A100 en esta GTC 2021

NVIDIA FGX GTC 2021

NVIDIA no ha presentado ninguna arquitectura gráfica, pero ha renovado sus ordenadores DGX, los cuales traen consigo varias GPUs NVIDIA A100, basadas en la arquitectura Ampere para computación de alto rendimiento, la cual no debe confundirse con la de las RTX 3000, ya que se diferencian en bastantes puntos.

¿La novedad? Ahora en vez de 40 GB de memoria HBM2 por A100 estos disponen de 80 GB, por lo que la capacidad de almacenamiento de su VRAM ha duplicado.

NVIDIA AERIAL A100

Por otro lado, NVIDIA ha creado una nueva gama de productos llamada Aerial A100 que combina un procesador Bluefield con una A100 para crear una especie de centralita avanzada para las comunicaciones 5G. Se trata de una nueva gama de productos por parte de NVIDIA que nace de la compra de Mellanox y que aún hemos de ver como se desarrolla para el futuro, pero que demuestra el interés de NVIDIA por entrar en nuevos mercados, especialmente en el del Big Data donde se manejan grandes cantidades de información y que está relacionado con la inteligencia artificial donde se manejan grandes cantidades de datos, donde la mayoría van a viajas a través de las redes 5G.

 NVIDIA Grace, la CPU ARM de NVIDIA para HPC

NVIDIA GRACE

No es la primera vez que AMD desarrolla una CPU basada en la ISA ARM, ya vimos varios de sus intentos en varios NVIDIA Tegra. El primer intento fue en el Tegra K1 con Denver, Tegra X2 recibió Denver 2 y Tegra Xavier, el más reciente de los SoC Tegra, recibió como CPU la arquitectura Carmel. La gran diferencia es que esta vez Grace no va a formar parte de un SoC, sino que va a ser una CPU independiente de alto calibre que NVIDIA utilizará para crear sus servidores de cara a 2023. La fecha en la que Grace aparecerá en el mercado.

¿Pero qué especificaciones promete tener Grace? Por el momento no han dado información sobre la cantidad de núcleos que tendrá, pero podemos confiar que serán decenas e incluso podría superar la centena. ¿Cómo lo sabemos? Pues por el hecho que sus interfaces con la memoria, GPU y otras CPU es realmente masivo.

NVIDIA Grace Roadmap

Llama poderosamente la atención es una interfaz LPDDR5X de más de 500 GB/s, lo que nos indica que es una CPU de gran tamaño, ya que para poder alcanzar ese nivel de potencia se requiere una interfaz con la memoria muy ancha y por tanto un perímetro en el chip enorme. A eso se le ha de sumar un ancho de banda vía NVLink 4 de 900 GB/s con la GPU y de 600 GB/s con otra CPU Grace, los cuales también nos indican un chip de gran tamaño.

¿La potencia de los núcleos? NVIDIA se ha limitado a decir es que cada uno de estos superan los 300 puntos en el benchmark SPECrate2017_int-b y van a utilizar la arquitectura Neoverse de ARM. NVIDIA pretende lanzar Grace en 2023.