Tras la presentación y lanzamiento de las RTX 30 o 3000, NVIDIA presentó su nueva generación de tarjetas gráficas para gaming dentro de su familia GeForce. Esta vez bajo la arquitectura Ada Lovelace. Unos años más tarde, conocemos todos los modelos y especificaciones que estas incluyeron, ¿sabes qué novedades introdujeron las RTX 40?
Las RTX 4000 son la tercera generación de las tarjetas gráficas de NVIDIA con capacidad de reproducir gráficos con Ray Tracing a tiempo real. Aunque tampoco nos podemos olvidar que también es la tercera vez que vimos la implementación de sus Tensor Cores para acelerar algoritmos de inteligencia artificial. La arquitectura con nombre en clave Ada Lovelace se presentó con tres modelos iniciales: la RTX 4090 de 24 GB, la RTX 4080 de 16 GB y la RTX 4080 de 12 GB. Y con importantes novedades con las que quieren recortar más la distancia con sus rivales en cuanto a rendimiento, especialmente en lo que al trazado de rayos se refiere.
Las gráficas más potentes de la generación RTX 4090 y RTX 4080
Hace ya unos años, NVIDIA presentó la generación más potente hasta la fecha de tarjetas gráficas, la arquitectura utilizada en las RTX 40 o 4000 recibió el nombre de Ada Lovelace y con ella se presentaron tres modelos de tarjetas gráficas, aunque posteriormente la compañía comenzó a lanzar nuevos modelos para todos los presupuestos.
Los chips gráficos o GPU que es el corazón de las tarjetas gráficas de NVIDIA está construido bajo el proceso de 4 nm de TSMC, por lo que volvieron a la fundición Taiwanesa tras su marcha momentánea con la anterior generación, cuyo chip se fabricó en Samsung bajo el nodo de 8 nm.
NVIDIA RTX 4090
Con el mismo diseño industrial que las series RTX 30, pero con un ventilador de mayor tamaño, NVIDIA nos enseñó la imagen de la RTX 4090. La cual desde un principio indicaron que que sería entre 2 y 4 veces más rápida que la 3090 Ti, la tarjeta gráfica más potente de NVIDIA en la época previa al lanzamiento de las series 40. La cantidad de memoria que lleva son 24 GB GDDR6X a una velocidad de 21 Gbps, por lo que tiene el mismo ancho de banda que la RTX 3090 Ti, 1 TB/s.
En cuanto a su precio, hemos visto cómo ha variado en los últimos meses y años, siendo el precio recomendado 1959€, pero que por lo general durante su lanzamiento siempre se mantuvo superior a los 2000€, mientras que actualmente hemos visto como dependiendo de la época podía experimentar variaciones de entre 200 y 300€, llegando a estar a un precio mínimo de 1700€.
NVIDIA RTX 4080
Al mismo tiempo, NVIDIA lanzó la RTX 4080, sin embargo sabemos que pese al nombre homónimo no se trata de dos tarjetas gráficas con la misma GPU en cuanto a configuración. Eso si, ambas comparten la misma arquitectura, pero una tiene 12 GB de memoria de vídeo la otra 16 GB.
En cuanto a los precios nos llevamos otro jarro de agua fría, ya que el precio de venta recomendado para la versión de 16 GB es de 1199 dólares en los Estados Unidos. Mientras qué aquí en Europa el de 12 GB se podían conseguir por 1099 € y el de 16 GB costaba 1469 €. En lo que a su rendimiento se refiere, NVIDIA consiguió un rendimiento entre 2 y 4 veces mayor que la RTX 3080 Ti.
NVIDIA RTX 4070 y 4060
Con el lanzamiento de las gamas altas, NVIDIA también comenzó a pensar, al igual que con las series 30, en las personas de a pie que no podían permitirse pagar lo que costaba una 4080 o una 4090, aunque hemos pasado por tiempos bastante oscuros, la 4070 y la 4060 se convirtieron rápidamente en la opción de muchas personas. Mientras que la versión 4060 resultaba más barata (unos 500€ menos aproximadamente), la RTX 4070 ofrecía en general unas especificaciones muy superiores.
Podemos encontrar, que la 4070 base tiene 12 GB de VRAM, 21000 MHz, un bus de memoria de 192-bit, un ancho de banda de 504.2 GB/s y un rendimiento de coma flotante de 29.15 TFLOPS. Mientras tanto, la 4060 siendo la solución más barata ofrece 8 GB de VRAM, 17000 MHz, un bus de memoria de 128-bit, un ancho de banda de 272 GB/s y un rendimiento de coma flotante de 15.11 TFLOPS, por lo que podemos notar la gran diferencia que existe entre una y otra.
NVIDIA RTX series 40, Super y Ti
Los lanzamientos de gama media ofrecieron a NVIDIA la oportunidad de abarcar una gran parte del mercado, pero la potencia que ofrecían algunas de las gráficas se quedaban cortas para llegar hasta la siguiente generación, las series 50 cuya arquitectura se ha denominado «Blackwell». Es por ello, que para renovar en ciertos momentos el mercado de las tarjetas gráficas presentaron las versiones Ti y Super de algunas de sus GPU, ofreciendo un rendimiento mucho mayor.
En comparación para las Ti, podemos tener en cuenta, por ejemplo, la RTX 4060, cuya versión normal tan solo ofrece 8 GB de VRAM, mientras que la edición Ti tiene 16 GB, pero que también resulta superior en el resto de especificaciones.
Por otra parte tenemos también las versiones Super de las gráficas de NVIDIA, cuyo lanzamiento fue especifico para las 4070 y las 4080, con la idea de ofrecer una mayor potencia y rendimiento sin que afectase al precio, ya que tenían el mismo precio de venta recomendado que las versiones normales de dichas GPU. Obviamente las características son mucho superiores, ya que las versiones Super ofrecían más VRAM, velocidades del reloj más altas y en general especificaciones superiores.
Mejoras en la arquitectura Ada Lovelace de las RTX 4000
Además, NVIDIA mostró las siguientes novedades con respecto a la arquitectura de su nueva familia de tarjetas gráficas, algunas de ellas hemos de reconocer que nos dejaron sorprendidos en su presentación ya que no nos las esperábamos, otras, en cambio, son una mejora incremental de lo ya visto anteriormente, pero de igual manera lo que trajeron de nuevo nos ha impresionó muy gratamente.
Mejoras incrementales en el chip
Lo primero que presentó NVIDIA, y de lo cual tuvimos los primeros datos e información fue sobre el rendimiento en bruto del chip AD102, el que incorpora la RTX 4090 y el más potente que desarrolló bajo la nueva arquitectura Ada Lovelace.
Entre las mejoras podemos destacar:
- 76.000 millones de transistores.
- 90 TFLOPS de potencia en FP32 con una eficiencia hasta dos veces superior que la generación anterior.
- RT Core de tercera generación, con una potencia de cálculo equivalente a 200 TFLOPS y con la capacidad de calcular el doble de intersecciones rayo-caja y rayo-triángulo que la generación anterior.
- Nuevo Tensor Core, con 1400 TFLOPS o 1.4 PetaFLOPS de potencia. Soporte para datos en FP8.
- Nuevo Optical Flow Accelerator, del cual todavía no han dado datos, pero se trata de una pieza de hardware inédita hasta el momento en una GPU.
Shader Execution Reordering
Bajo este nombre de Shader Execution Reordering NVIDIA anunció que las RTX 40 con arquitectura Ada Lovelace fueron las primeras GPU de la historia con ejecución fuera de orden. Una forma de ejecutar las instrucciones que llevaba en las CPU para PC desde mediados de los 90 e indica como han evolucionado los núcleos de las GPU hasta el momento en lo que a complejidad se refiere.
Por lo que NVIDIA ha consiguió dar paso de gigante abandonando por completo el clásico método Round-Robin que se lleva usando desde las primeras gráficas con shaders programables. En el ámbito de ejecutar código en una GPU en forma de programas shader, ya sea para gráficos o para computación, es uno de los saltos más importantes que se han hecho en la historia del hardware gráfico.
Esto además rompe por completo las comparaciones en lo que a TFLOPS se refiere, ya que las diferencias entre un procesador fuera de orden y uno que no lo es bajo la misma potencia de cálculo no son nada descartables.
DLSS 3
Otra de las mejoras que NVIDIA presentó es la tercera generación de su algoritmo de subida de resolución automático a través de aprendizaje profundo. En cuya tercera versión afirmaron desde un principio poder llegar a cuadriplicar la tasa de frames por segundo respecto al renderizado una escena a resolución nativa.
La clave para dicha mejora respecto al DLSS 3 son dos: el Optical Flow Accelerator y el Optical Multi-Frame Generator, los cuales se suman como elementos a los que ya estaban implementados en el DLSS 2.0. El uso del Optical Flow Accelerator y que NVIDIA lo haya mencionado como parte de la circuitería de los chips de las RTX 40 es una confirmación de que el DLSS 3 es exclusivo de las RTX 4000.
Mejoras en el Ray Tracing
De cara al Ray Tracing NVIDIA consiguió pasar de las 39 operaciones por pixel de la NVIDIA RTX 2080 Ti lanzada en 2018 hasta a un equivalente de 635 operaciones por píxel de la RTX 4090. Un aumento de 60 veces respecto al original.
Jensen Huang dejó claro desde un principio que buena parte del aumento de rendimiento viene por la predicción a través de la IA y el DLSS 3, no solo por potencia bruta. Por lo que la mayoría de los píxeles se predicen a través de IA y no son calculados.
RTX Remix
NVIDIA también presentó RTX Remix, una aplicación que permite capturar juegos antiguos a través de Omniverse y nos permite recrearlos de nuevo con las nuevas tecnologías como el Ray Tracing. Cuando hemos visto esta tecnología no nos hemos podido creer por lo impresionante que resulta. ¿Cuántos juegos clásicos serán rehechos y puestos al día tanto por sus creadores como por los fans?
Por el momento el primer ejemplo lo tenemos con Portal with RTX, una remasterización del clásico de puzzles de Valve con Omniverse y totalmente renderizado a través de Ray Tracing y NVIDIA DLSS 3. Saldrá en noviembre de forma gratuita para los poseedores del juego en Steam.