Tras la presentación y lanzamiento de las RTX 30 o 3000, NVIDIA presentó su nueva generación de tarjetas gráficas para gaming dentro de su familia GeForce. Esta vez bajo la arquitectura Ada Lovelace. Unos años más tarde, conocemos todos los modelos y especificaciones que estas incluyeron, ¿sabes qué novedades introdujeron las RTX 40?
Las RTX 4000 son la tercera generación de las tarjetas gráficas de NVIDIA con capacidad de reproducir gráficos con Ray Tracing a tiempo real. Aunque tampoco nos podemos olvidar que también es la tercera vez que vimos la implementación de sus Tensor Cores para acelerar algoritmos de inteligencia artificial. La arquitectura con nombre en clave Ada Lovelace se presentó con tres modelos iniciales: la RTX 4090 de 24 GB, la RTX 4080 de 16 GB y la RTX 4080 de 12 GB. Y con importantes novedades con las que quieren recortar más la distancia con sus rivales en cuanto a rendimiento, especialmente en lo que al trazado de rayos se refiere.
Tarjetas gráficas RTX 4000
Hace ya unos años, NVIDIA presentó la generación más potente hasta la fecha de tarjetas gráficas, la arquitectura utilizada en las RTX 40 o 4000 recibió el nombre de Ada Lovelace y con ella se presentaron tres modelos de tarjetas gráficas, aunque posteriormente la compañía comenzó a lanzar nuevos modelos para todos los presupuestos.
Los chips gráficos o GPU que es el corazón de las tarjetas gráficas de NVIDIA está construido bajo el proceso de 4 nm de TSMC, por lo que volvieron a la fundición Taiwanesa tras su marcha momentánea con la anterior generación, cuyo chip se fabricó en Samsung bajo el nodo de 8 nm.
NVIDIA RTX 4090
Con el mismo diseño industrial que las series RTX 30, pero con un ventilador de mayor tamaño, NVIDIA nos enseñó la imagen de la RTX 4090. La cual desde un principio indicaron que sería entre 2 y 4 veces más rápida que la 3090 Ti, la tarjeta gráfica más potente de NVIDIA en la época previa al lanzamiento de las series 40. La cantidad de memoria que lleva son 24 GB GDDR6X a una velocidad de 21 Gbps, por lo que tiene el mismo ancho de banda que la RTX 3090 Ti, 1 TB/s.
En cuanto a su precio, hemos visto cómo ha variado en los últimos meses y años, siendo el precio recomendado 1.959 €, pero que por lo general durante su lanzamiento siempre se mantuvo superior a los 2.000 €, mientras que actualmente hemos visto como dependiendo de la época podía experimentar variaciones de entre 200 y 300 €, llegando a estar a un precio mínimo de 1.700 €.
RTX 4090D
Modelo especial de la RTX 4090 bastante recortado que se ha diseñado para el mercado chino. Es una respuesta a la prohibición de Estados Unidos la venta a China, cuya potente de cómputo supere un cierto umbral.
Concretamente, este modelo cuenta con 14.592 CUDA Cores, así como 456 Tensor Cores y 114 RT Cores. No parece un gran recorte, pero es suficiente para cumplir con los baremos estadounidenses.
NVIDIA RTX 4080 SUPER
NVIDIA presentó la RTX 4080 SUPER en enero de 2024, una gráfica que cuenta con 16 GB de memoria GDDR6X de 256 bits. Cuenta con 10240 núcleos CUDA, 500 más que la RTX 4080, 836 Tensor Cores, 121 cores para Ray Tracing y la velocidad máxima de reloj es de 2.55 GHz.
NVIDIA RTX 4080
Al mismo tiempo, NVIDIA lanzó la RTX 4080, sin embargo, sabemos que pese al nombre homónimo no se trata de dos tarjetas gráficas con la misma GPU en cuanto a configuración. Eso si, ambas comparten la misma arquitectura, pero una tiene 12 GB de memoria de vídeo, la otra 16 GB.
En cuanto a los precios, nos llevamos otro jarro de agua fría, ya que el precio de venta recomendado para la versión de 16 GB es de 1199 dólares en los Estados Unidos. Mientras qué aquí en Europa el de 12 GB se podían conseguir por 1099 € y el de 16 GB costaba 1469 €. En lo que a su rendimiento se refiere, NVIDIA consiguió un rendimiento entre 2 y 4 veces mayor que la RTX 3080 Ti.
NVIDIA RTX 4070 Ti SUPER
NVIDIA RTX 4070 Ti SUPER se presentó en el mismo evento que la RTX 4080, en enero de 2024. Esta cuenta con un total de 8448 núcleos CUDA, cuenta con 16 GB de memoria de vídeo GDDR6X de 256 bits, utilizar Tensor Cores de 4ª generación para ofrecer un rendimiento de 706 TOPS y la velocidad máxima del reloj es de 2,61 GHz.
NVIDIA RTX 4070 Ti
Esta es la hermana pequeña de la RTX 4070 Ti SUPER. A diferencia de la versión SUPER, cuenta 12 GB de memoria de vídeo GDDR6 de 192 bits. Cuenta con un total de 7680 núcleos CUDA y tiene un rendimiento de IA de 641 TOPS. En cuanto a la velocidad de reloj, hablamos de 2,61 GHz.
NVIDIA RTX 4070
Es una solución a caballo entre las gráficas de gama alta y la gama de entrada. Se sitúa en una posición muy interesante, ya que tiene capacidad de sobras para mover juegos en resolución 1440p. Puede ejecutar juegos en resolución 4K, aunque presentará ciertas dificultades.
Nos ofrece esta tarjeta gráfica un total de 5.888 CUDA Cores, 46 RT Cores y un total de 184 Tensor Cores. Trabaja a una frecuencia base de 1.920 MHz y puede llegar en modo Boost a los 2.475 MHz. Se complementa esta tarjeta gráfica con 12 GB de memoria GDDR6X con una interfaz de 192 bits y un ancho de banda de 504 GB/s.
NVIDIA RTX 4060 Ti
Un paso por delante de la RTX 4060, la gama de entrada a la serie RTX 40 de NVIDIA, encontramos la RTX 4060 Ti, una gráfica que cuenta con 4352 núcleos CUDA, está disponible en versiones de 8 y 16 GB de memoria GDDR6 de 128 bits (no GDDR6X), ofrece un rendimiento de 353 TOPS para IA y la velocidad máxima del reloj es de 2.54 GHz.
NVIDIA RTX 4060
Solución más básica que ofrece actualmente la compañía pensada, sobre todo, para jugar en resolución 1080p. Algunos juegos pueden ser ejecutados en resolución 1440p, aunque para ello se requiere activar el DLSS. Es una de las más vendidas del mercado por su excelente relación calidad/precio.
Cuenta esta tarjeta gráfica con un total de 3.072 CUD Cores trabajando a una frecuencia base de 1.830 MHz y en modo Boost puede llegar a los 2.460 MHz. Se complementa con 24 RT Cores y 96 Tensor Coes. Dispone de un total de 8 GB de memoria gráfica de tipo GDDR6 con un ancho de banda de 272 GB/s.
Novedades de la GeForce RTX 4000
Además, NVIDIA mostró las siguientes novedades con respecto a la arquitectura de su nueva familia de tarjetas gráficas, algunas de ellas hemos de reconocer que nos dejaron sorprendidos en su presentación, ya que no nos las esperábamos, otras, en cambio, son una mejora incremental de lo ya visto anteriormente, pero de igual manera lo que trajeron de nuevo nos ha impresionado muy gratamente.
Mejoras incrementales en el chip
Lo primero que presentó NVIDIA, y de lo cual tuvimos los primeros datos e información, fue sobre el rendimiento en bruto del chip AD102, el que incorpora la RTX 4090 y el más potente que desarrolló bajo la nueva arquitectura Ada Lovelace.
Entre las mejoras podemos destacar:
- 76.000 millones de transistores.
- 90 TFLOPS de potencia en FP32 con una eficiencia hasta dos veces superior que la generación anterior.
- RT Core de tercera generación, con una potencia de cálculo equivalente a 200 TFLOPS y con la capacidad de calcular el doble de intersecciones rayo-caja y rayo-triángulo que la generación anterior.
- Nuevo Tensor Core, con 1400 TFLOPS o 1.4 PetaFLOPS de potencia. Soporte para datos en FP8.
- Nuevo Optical Flow Accelerator, del cual todavía no han dado datos, pero se trata de una pieza de hardware inédita hasta el momento en una GPU.
Shader Execution Reordering
Bajo este nombre de Shader Execution Reordering NVIDIA anunció que las RTX 40 con arquitectura Ada Lovelace fueron las primeras GPU de la historia con ejecución fuera de orden. Una forma de ejecutar las instrucciones que llevaba en las CPU para PC desde mediados de los 90 e indica como han evolucionado los núcleos de las GPU hasta el momento en lo que a complejidad se refiere.
Por lo que NVIDIA a consiguió dar paso de gigante abandonando por completo el clásico método Round-Robin que se lleva usando desde las primeras gráficas con shaders programables. En el ámbito de ejecutar código en una GPU en forma de programas shader, ya sea para gráficos o para computación, es uno de los saltos más importantes que se han hecho en la historia del hardware gráfico.
Esto además rompe por completo las comparaciones en lo que a TFLOPS se refiere, ya que las diferencias entre un procesador fuera de orden y uno que no lo es bajo la misma potencia de cálculo no son nada descartables.
DLSS 3
Otra de las mejoras que NVIDIA presentó es la tercera generación de su algoritmo de subida de resolución automático a través de aprendizaje profundo. En cuya tercera versión afirmaron desde un principio poder llegar a cuadriplicar la tasa de frames por segundo respecto al renderizado una escena a resolución nativa.
La clave para dicha mejora respecto al DLSS 3 son dos: el Optical Flow Accelerator y el Optical Multi-Frame Generator, los cuales se suman como elementos a los que ya estaban implementados en el DLSS 2.0. El uso del Optical Flow Accelerator y que NVIDIA lo haya mencionado como parte de la circuitería de los chips de las RTX 40 es una confirmación de que el DLSS 3 es exclusivo de las RTX 4000.
Mejoras en el Ray Tracing
De cara al Ray Tracing NVIDIA consiguió pasar de las 39 operaciones por pixel de la NVIDIA RTX 2080 Ti lanzada en 2018 hasta a un equivalente de 635 operaciones por píxel de la RTX 4090. Un aumento de 60 veces respecto al original.
Jensen Huang dejó claro desde un principio que buena parte del aumento de rendimiento viene por la predicción a través de la IA y el DLSS 3, no solo por potencia bruta. Por lo que la mayoría de los píxeles se predicen a través de IA y no son calculados.
RTX Remix
NVIDIA también presentó RTX Remix, una aplicación que permite capturar juegos antiguos a través de Omniverse y nos permite recrearlos de nuevo con las nuevas tecnologías como el Ray Tracing. Cuando hemos visto esta tecnología no nos hemos podido creer por lo impresionante que resulta. ¿Cuántos juegos clásicos serán rehechos y puestos al día tanto por sus creadores como por los fans?
Por el momento el primer ejemplo lo tenemos con Portal with RTX, una remasterización del clásico de puzles de Valve con Omniverse y totalmente renderizado a través de Ray Tracing y NVIDIA DLSS 3. Saldrá en noviembre de forma gratuita para los poseedores del juego en Steam.