Tras la presentación y lanzamiento de las RTX 30 o 3000, NVIDIA presentó grandes novedades en las tarjetas gráficas para gaming dentro de su familia GeForce RTX. Esta vez bajo la arquitectura Ada Lovelace. Unos años más tarde, conocemos todos los modelos y especificaciones que estas incluyeron, ¿sabes qué novedades introdujeron las RTX 40?
Las RTX 4000 son la tercera generación de las tarjetas gráficas de NVIDIA con capacidad de reproducir gráficos con Ray Tracing a tiempo real. Aunque tampoco nos podemos olvidar que también es la tercera vez que vimos la implementación de sus Tensor Cores para acelerar algoritmos de inteligencia artificial. La arquitectura con nombre en clave Ada Lovelace se presentó con tres modelos iniciales: la RTX 4090 de 24 GB, la RTX 4080 de 16 GB y la RTX 4080 de 12 GB. Y con importantes novedades con las que quieren recortar más la distancia con sus rivales en cuanto a rendimiento, especialmente en lo que al trazado de rayos se refiere.
Tarjetas gráficas RTX 4000
Hace ya unos años, NVIDIA presentó la generación más potente hasta la fecha de tarjetas gráficas, la arquitectura utilizada en las RTX 40 o 4000 recibió el nombre de Ada Lovelace y con ella se presentaron tres modelos de tarjetas gráficas, aunque posteriormente la compañía comenzó a lanzar nuevos modelos para todos los presupuestos.
Los chips gráficos o GPU que es el corazón de las tarjetas gráficas de NVIDIA está construido bajo el proceso de 4 nm de TSMC, por lo que volvieron a la fundición Taiwanesa tras su marcha momentánea con la anterior generación, cuyo chip se fabricó en Samsung bajo el nodo de 8 nm.
RTX 4090
La primera tarjeta gráfica que pudimos encontrar en la presentación de las RTX 40 fue, como tiene ya NVIDIA por costumbre, el modelo más avanzado y que representaba al buque insignia de la compañía, la RTX 4090. Esta gráfica llegó con dos variantes centradas en regiones muy distintas, la primera es el modelo normal que llegó a occidente y luego tenemos el modelo RTX 4090D específico para China con características mucho más limitadas.
| RTX 40 | RTX 4090 | RTX 4090D |
|---|---|---|
| GPU | AD102-300-A1 | AD102-250-A1 |
| Shading Units | 16384 | 14592 |
| TMUs | 512 | 456 |
| ROPs | 176 | 176 |
| SM Count | 128 | 114 |
| Tensor Cores | 512 | 456 |
| RT Cores | 128 | 114 |
| Reloj base | 2235 MHz | 2280 MHz |
| Reloj boost | 2520 MHz | 2520 MHz |
| Tamaño memoria | 24 GB | 24 GB |
| Tipo memoria | GDDR6X | GDDR6X |
| Bus memoria | 384 bit | 384 bit |
| Ancho de banda | 1.01 TB/s | 1.01 TB/s |
| FP32 | 82.58 TFLOPS | 73.54 TFLOPS |
| TDP | 450 W | 425 W |
| Lanzamiento | 20/9/2022 | 28/12/2023 |
| Precio lanzamiento | 1959€/1599$ | 1599$ |
RTX 4080
Después de la gráfica buque insignia que lanzó la compañía también pudimos ver dos nuevos modelos que representaban a la gama alta, estos tenían unas capacidad realmente altas que no dejaban a nadie indiferente. Se lanzaron dos modelos ya que con el paso del tiempo aparecieron las RTX 40 Super tanto para esta gráfica como para las 4070, tenían unas especificaciones mejoradas pero sin cambiar el precio original.
| RTX 40 | RTX 4080 | RTX 4080 Super |
|---|---|---|
| GPU | AD103-300-A1 | AD103-400-A1 |
| Shading Units | 9728 | 10240 |
| TMUs | 304 | 320 |
| ROPs | 112 | 112 |
| SM Count | 76 | 80 |
| Tensor Cores | 304 | 320 |
| RT Cores | 76 | 80 |
| Reloj base | 2205 MHz | 2295 MHz |
| Reloj boost | 2505 MHz | 2550 MHz |
| Tamaño memoria | 16 GB | 16 GB |
| Tipo memoria | GDDR6X | GDDR6X |
| Bus memoria | 256 bit | 256 bit |
| Ancho de banda | 716.8 GB/s | 736.3 GB/s |
| FP32 | 48.74 TFLOPS | 52.22 TFLOPS |
| TDP | 320 W | 320 W |
| Lanzamiento | 20/9/2022 | 8/1/2024 |
| Precio lanzamiento | 1.469€/1,199$ | 1119€/999$ |
RTX 4070
Además de las gráficas de gama alta la compañía también presento unos cuantos modelos diseñados para la gama media, estos son los que pertenecen a las RTX 4070 entre las que podemos encontrar cuatro modelos distintos, la versión básica, la tarjeta básica Super, el modelo Ti y la gráfica renovada Ti Super. El principal objetivo de estos modelos era ofrecer un punto intermedio entre el rendimiento y el precio, aunque las versiones Ti alcanzaban precios bastante similares a los de la 4080 cuando llegaron al mercado.
| RTX 40 | RTX 4070 | RTX 4070 Super | RTX 4070 Ti | RTX 4070 Ti Super |
|---|---|---|---|---|
| GPU | AD104-250-A1 | AD104-350-A1 | AD104-250-A1 | AD103-275-A1 |
| Shading Units | 5888 | 7168 | 7680 | 8448 |
| TMUs | 184 | 224 | 240 | 264 |
| ROPs | 64 | 80 | 80 | 96 |
| SM Count | 46 | 56 | 60 | 66 |
| Tensor Cores | 184 | 224 | 240 | 264 |
| RT Cores | 46 | 56 | 60 | 66 |
| Reloj base | 1920 MHz | 1980 MHz | 2310 MHz | 2340 MHz |
| Reloj boost | 2475 MHz | 2475 MHz | 2610 MHz | 2610 MHz |
| Tamaño memoria | 12 GB | 12 GB | 12 GB | 16 GB |
| Tipo memoria | GDDR6X | GDDR6X | GDDR6X | GDDR6X |
| Bus memoria | 192 bit | 192 bit | 192 bit | 256 bit |
| Ancho de banda | 504.2 GB/s | 504.2 GB/s | 504.2 GB/s | 672.3 GB/s |
| FP32 | 29.15 TFLOPS | 35.48 TFLOPS | 40.09 TFLOPS | 44.10 TFLOPS |
| TDP | 200 W | 220 W | 285 W | 285 W |
| Lanzamiento | 12/4/2023 | 8/1/2024 | 3/1/2023 | 8/1/2024 |
| Precio lanzamiento | 669€/599$ | 669€/599$ | 889€/799$ | 889€/799$ |
RTX 4060
Y por último llegamos hasta los modelos diseñados para la gama baja, las gráficas RTX 4060 que llegaron las últimas dentro del lanzamiento general de esta generación y que ofrecían las especificaciones más bajas. A su vez el precio también se reducía bastante, a diferencia de las 4070 y las 4080 no recibieron ninguna actualización de los modelos Super ya que estaban orientadas para un público con mucho menos presupuesto.
| RTX 40 | RTX 4060 | RTX 4060 Ti |
|---|---|---|
| GPU | AD107-400-A1 | AD106-350-A1 |
| Shading Units | 3072 | 4352 |
| TMUs | 96 | 136 |
| ROPs | 48 | 48 |
| SM Count | 24 | 34 |
| Tensor Cores | 96 | 136 |
| RT Cores | 24 | 34 |
| Reloj base | 1830 MHz | 2310 MHz |
| Reloj boost | 2460 MHz | 2535 MHz |
| Tamaño memoria | 8 GB | 8 GB/16 GB |
| Tipo memoria | GDDR6 | GDDR6 |
| Bus memoria | 128 bit | 128 bit |
| Ancho de banda | 272.0 GB/s | 288.0 GB/s |
| FP32 | 15.11 TFLOPS | 22.06 TFLOPS |
| TDP | 115 W | 160 W |
| Lanzamiento | 18/5/2023 | 18/5/2023 |
| Precio lanzamiento | 329€/299$ | 449€ y 559€/399$ y 499$ |
Novedades de la GeForce RTX 4000
Además, NVIDIA mostró las siguientes novedades con respecto a la arquitectura de su nueva familia de tarjetas gráficas, algunas de ellas hemos de reconocer que nos dejaron sorprendidos en su presentación, ya que no nos las esperábamos, otras, en cambio, son una mejora incremental de lo ya visto anteriormente, pero de igual manera lo que trajeron de nuevo nos ha impresionado muy gratamente.
Mejoras incrementales en el chip
Lo primero que presentó NVIDIA, y de lo cual tuvimos los primeros datos e información, fue sobre el rendimiento en bruto del chip AD102, el que incorpora la RTX 4090 y el más potente que desarrolló bajo la nueva arquitectura Ada Lovelace.
Entre las mejoras podemos destacar:
- 76.000 millones de transistores.
- 90 TFLOPS de potencia en FP32 con una eficiencia hasta dos veces superior que la generación anterior.
- RT Core de tercera generación, con una potencia de cálculo equivalente a 200 TFLOPS y con la capacidad de calcular el doble de intersecciones rayo-caja y rayo-triángulo que la generación anterior.
- Nuevo Tensor Core, con 1400 TFLOPS o 1.4 PetaFLOPS de potencia. Soporte para datos en FP8.
- Nuevo Optical Flow Accelerator, del cual todavía no han dado datos, pero se trata de una pieza de hardware inédita hasta el momento en una GPU.
Shader Execution Reordering
Bajo este nombre de Shader Execution Reordering NVIDIA anunció que las RTX 40 con arquitectura Ada Lovelace fueron las primeras GPU de la historia con ejecución fuera de orden. Una forma de ejecutar las instrucciones que llevaba en las CPU para PC desde mediados de los 90 e indica como han evolucionado los núcleos de las GPU hasta el momento en lo que a complejidad se refiere.
Por lo que NVIDIA a consiguió dar paso de gigante abandonando por completo el clásico método Round-Robin que se lleva usando desde las primeras gráficas con shaders programables. En el ámbito de ejecutar código en una GPU en forma de programas shader, ya sea para gráficos o para computación, es uno de los saltos más importantes que se han hecho en la historia del hardware gráfico.
Esto además rompe por completo las comparaciones en lo que a TFLOPS se refiere, ya que las diferencias entre un procesador fuera de orden y uno que no lo es bajo la misma potencia de cálculo no son nada descartables.
DLSS 3
Otra de las mejoras que NVIDIA presentó es la tercera generación de su algoritmo de subida de resolución automático a través de aprendizaje profundo. En cuya tercera versión afirmaron desde un principio poder llegar a cuadriplicar la tasa de frames por segundo respecto al renderizado una escena a resolución nativa.
La clave para dicha mejora respecto al DLSS 3 son dos: el Optical Flow Accelerator y el Optical Multi-Frame Generator, los cuales se suman como elementos a los que ya estaban implementados en el DLSS 2.0. El uso del Optical Flow Accelerator y que NVIDIA lo haya mencionado como parte de la circuitería de los chips de las RTX 40 es una confirmación de que el DLSS 3 es exclusivo de las RTX 40 en adelante. Este tipo de implementación se refuerza en la serie RTX 50 de la compañía ya que mientras las gráficas de la serie 4000 añaden la generación de fotogramas, las de la serie 5000 cuentan con una nueva función que es la generación de fotogramas múltiple.
El resto de funciones como la superresolución DLSS, la reconstrucción de rayos o el DLAA está disponible en las demás generaciones gracias a DLSS 4, pero las dos mencionadas son exclusivas de las generaciones más recientes.
Mejoras en el Ray Tracing
De cara al Ray Tracing NVIDIA consiguió pasar de las 39 operaciones por pixel de la NVIDIA RTX 2080 Ti lanzada en 2018 hasta a un equivalente de 635 operaciones por píxel de la RTX 4090. Un aumento de 60 veces respecto al original. Esto ha fomentado que cada vez más títulos implementen dicha tecnología, pero incluso a día de hoy sigue estando reservada para ordenadores de alta gama ya que muchos de los títulos actuales no cuentan con una optimización adecuada para ofrecer un rendimiento óptimo al activarla.
Jensen Huang dejó claro desde un principio que buena parte del aumento de rendimiento viene por la predicción a través de la IA y el DLSS 3, no solo por potencia bruta. Por lo que la mayoría de los píxeles se predicen a través de IA y no son calculados. Esto implica que es más sencillo ampliar las capacidades que tiene la gráfica en este campo, algo que también se aplica a las capacidades que tienen dichas tarjetas para funciones relacionadas con la inteligencia artificial.
RTX Remix
NVIDIA también presentó RTX Remix, una aplicación que permite capturar juegos antiguos a través de Omniverse y nos permite recrearlos de nuevo con las nuevas tecnologías como el Ray Tracing. Cuando hemos visto esta tecnología no nos hemos podido creer por lo impresionante que resulta. ¿Cuántos juegos clásicos serán rehechos y puestos al día tanto por sus creadores como por los fans?
El primer ejemplo que encontramos de esta tecnología es Portal with RTX, una remasterización del clásico de puzles de Valve con Omniverse y totalmente renderizado a través de Ray Tracing y NVIDIA DLSS 3. pero también hay otros juegos que utilizan dicha tecnología como sucede con Half-Life 2 RTX que se basa en añadir los mismos cambios, nuevas texturas y efectos junto con la implementación del Ray Tracing. El problema que tienen estos títulos está en la necesidad de un ordenador potente que además incorpore una gráfica de NVIDIA, mientras que sus principales ventajas son el gran cambio visual que supone así como el hecho de que son mods gratuitos.
