NVIDIA destroza a AMD: Quantum-2, DRIVE y Jetson Orin con 12 Cores ARM

Tras una larga, muy larga presentación NVIDIA ha puesto sobre la mesa el hardware del futuro para la alta computación, HPC, DL, robótica e IA, donde lo que horas antes había presentado AMD ha quedado en agua de borrajas tras lo que la compañía que preside Huang ha mostrado en el GTC 2021. Casi dos horas de presentación donde el futuro apunta hacia una serie de nuevos productos: Quantum-2, DRIVE Orin y Jetson Orin.

Hay que coger palomitas para disfrutar de lo presentado por Jensen Huang aquí, puesto que hablamos de la séptima generación de la arquitectura NVIDIA InfiniBand para Inteligencia Artificial y rendimiento en redes neuronales que afectará a todo el mundo de la supercomputación. ¿Qué veremos en breve en los centros de datos más punteros?

Pues lo que NVIDIA ha denominado como Omniverse, un ecosistema de hardware y software para una gran cantidad de industrias y sectores que se desglosa básicamente en varios productos más que interesantes e innovadores.

NVIDIA Quantum-2 InfiniBand

Los sistemas actuales son los grandes demandantes de potencia bruta cuando de HPC se habla y es que las infraestructuras de computación de alto rendimiento necesitan cada vez mayor potencia porque el volumen de datos no para de crecer.

NVIDIA-Quantum-2-Bluefield-3-DPU-InfiniBand-Networking-Platform-1

Se requiere también mayor velocidad de transferencia así como mayor eficiencia, lo que debe de dar como resultado un mayor número de interacciones en un menor tiempo logrando optimizar el tráfico interno de los servidores.

NVIDIA-Quantum-2,-Drive-y-Jetson-Orin-GTC-2021-(9)

Lo primero que debemos tener claro es que esta plataforma está basada en red de extremo a extremo y es la más potente jamás creada. Para ello hace acopio del conmutador Quantum-2, un adaptador de red ConnectX-7 y una DPU BlueField-3, todo gestionado por el software de la compañía que va incluido al parecer en el paquete.

Lo que se busca aquí es el llamado «rendimiento predictivo» ya que NVIDIA garantiza una supervisión proactiva, una gestión de la congestión para ofrecer aislamiento del tráfico generado y eliminando casi por completo las fluctuaciones del rendimiento de Quantum-2.

BlueField-3

NVIDIA-BlueField-3

Para ello hace acopio de una DPU BlueField-3 que logra el mejor rendimiento jamás logrado en un componente de este calibre y un HCA ConnectX-y compatible con PCIe 4.0 y 5.0 con puertos simples o duales a una velocidad de 400 Gbps, además de una mejor protección de los datos con gestión de aislamiento de usuarios.

La configuración tiene hasta 64 puertos de 400 Gbps o 128 puertos de 200 GB/s, todo en conectores físicos de 32 octales OSFP. La gran ventaja de esto es que al ser modular se puede optar por tres configuraciones totales distintas:

  • 2048 puertos de 400 Gb/s o 4.096 puertos de 200 Gb/s
  • 1.024 puertos de 400 Gb/s o 2.048 puertos de 200 Gb/s
  • 512 puertos de 400 Gb/s o 1.024 puertos de 200 Gb/s

El resultado de todo esto es un rendimiento bidireccional que la compañía afirma alcanzar los 1,64 petabits por segundo, o lo que es igual, 5 veces más que el Quantum InfiniBand de la generación que le precede. Todo esto además reduciendo el consumo de energía en un 7% y el espacio físico en los centros de datos y la necesidad de conmutadores de estructura en hasta 6 veces.

Esto es posible por el nodo 7N de TSMC, el cual ha propiciado que Quantum 2 tenga 57 mil millones de transistores, siendo el chip con mayor número de ellos de la historia de NVIDIA y superando lógicamente al A100 por 3 mil millones.

BlueField 3 InfiniBand llega hasta los 22 mil millones de transistores y ofrece 16 núcleos ARM de 64 bits también con el 7N en su haber.

ConnectX-7

NVIDIA-Quantum-2,-Drive-y-Jetson-Orin-GTC-2021-(10)

ConnectX-7 integra por su parte 8 mil millones de transistores en el mismo nodo 7N de TSMC e integra 16 cores y 256 Threads, lo que multiplica su rendimiento por 4 y su Throughput por 2 si lo comparamos con una GPU actual.

También duplica el rendimiento de RDMA, GPUDirect Storage, GPUDirect RDMA y In-Networking Computing, llegando en enero del año que viene para completar con ello la plataforma de NVIDIA.

NVIDIA DRIVE ORIN y Jetson AGX ORIN

NVIDIA-Jetson-AGX-Orin-SOC-Development-Kit-_1

Cambiando un poco de tercio tenemos los nuevos SoCs Orin que intentarán redefinir la robótica y los ecosistemas de desarrollo de la industria, donde se integran por supuestos el sector del automóvil y de la energía en general.

Lo que ha mostrado NVIDIA es un acercamiento y facilidad para una plataforma que se diversifica y que tiene que llegar a la mayor parte de la industria actual y futura, por lo que las aplicaciones son incalculables y escalables. Para situarnos, Orin es el sucesor de Xavier y llegará con dos apuestas muy claras y diferenciadas: DRIVE Orin y JETSON AGX ORIN para la IA en robótica general de próxima generación.

NVIDIA DRIVE Orin

NVIDIA-DRIVE-Orin

Es la plataforma de supercomputación integrada de segunda generación dentro de DRIVE como tal y su función ha sido definida de forma muy clara:

  • Registrar los datos de las cámaras del coche.
  • Registrar los datos del radar y los sensores.
  • Localizar el coche y su ubicación.
  • Planificar y supervisar la conducción y la carretera.

Este SoC específico para la industria de la automoción es un chip que ofrece 254 TOPS y con ello está más que capacitado para la conducción autónoma, el infoentretenimiento de nueva generación y la interacción con la IA para conductor y pasajeros.

Hablamos de un chip que es capaz de impulsar la conducción 100% autónoma de cualquier vehículo que lo integre hasta el nivel 5, el más alto de la industria. Por si fuese poco, DRIVE Orin acepta múltiples aplicaciones complejas a través de diferentes sistemas operativos entre los que se encuentran por ejemplo Linux, QNX y Android.

Jetson Orin

NVIDIA-Jetson-AGX-Orin

Centrada en la IA como su predecesor y más allá, así se puede definir ese SoC de 100 mm x 87 mm que es el Jetson AGX Orin, el cual según NVIDIA ofrece hasta 6 veces el rendimiento de su predecesor Xavier en el mismo formato compacto.

Este SoC está específicamente creado para albergarse en los principales robots de entrega, logística o sistemas de fabricación autónoma, así como incluso grandes vehículos aéreos. Consigue un rendimiento en IA de 200 TOPS en INT8 y posee en su haber una GPU Ampere con 2048 Shaders y 64 Tensor Cores a una frecuencia máxima de 1 GHz.

En cambio la CPU se basa en nada menos que 12 núcleos ARM A78AE V8.2 de 64 Bits con 3 MB de L2 y 6 MB de L3 con una frecuencia máxima de 2 GHz. El SoC si ya de por sí es espectacular añade en su haber 32 GB de LPDDR5 con un bus de 256 bits para dar un ancho de banda de 204,8 GB/s, lo que le permite controlar hasta 6 cámaras con 16 canales en total repartidas con las siguientes configuraciones:

  • 2 x 4K a 60 FPS.
  • 4 x 4K a 30 FPS.
  • 8 x 1080p a 60 FPS.
  • 16 x 1080p a 30 FPS.

Todo en H.265 y siendo cámaras para encode, mientras que para decode la configuración es distinta:

  • 1 x 8K a 30 FPS.
  • 3 x 4K a 60 FPS.
  • 6 x 4K a 30 FPS.
  • 12 x 1080p a 60 FPS.
  • 24 x 1080p a 30 FPS.

Si esto ya no fuese impactante de por sí, la resolución de pantalla que será capaz de manejar en los nuevos coches que lo integren es alucinante: 1 x 8K a 60 FPS con multi-mode DP 1.4a o HDMI 2.1, sin contar con las múltiples I/O que podrá tener:

  • 4x USB 2.0
  • 4x UART
  • 3x SPI
  • 4x I2S
  • 8x I2C
  • 2x CAN
  • DMIC & DSPK
  • GPIOs

Por último y no menos importante tenemos las configuraciones que podrán ser seleccionadas según su TDP, y es que los fabricantes tendrán desde los 15 vatios, pasando por los 30 vatios hasta los 50W. Jetson AGX Orin llegará en el Q1 de 2022 a un precio todavía desconocido.

5 Comentarios