NVIDIA GTX 1080 vs RTX 2080: diferencia de arquitectura y rendimiento entre estas dos tarjetas gráficas. ¿Merece la pena el salto generacional?

La salida al mercado de la última tarjeta gráfica de NVIDIA para la gama media ha supuesto un soplo de aire fresco a la gama RTX y por lo que parece en un primer momento un alivio para los de Huang, ya que han recibido una serie de críticas bastante elevada por los precios impuestos. Ya que toda la gama está completa es un gran momento para hacer comparaciones exhaustivas en cuanto a sus características y enfrentar a la GTX 1080 frente a la RTX 2080. NVIDIA GTX 1080 vs RTX 2080 ¿el salto generacional está justificado? Lo cierto es que la salida de la nueva gama de tarjetas gráficas por parte de NVIDIA ha supuesto un salto de rendimiento pero uno mucho mayor en precio, donde en un principio y a tenor de las siguientes especificaciones uno podría despistarse en cuanto a un ratio rendimiento/precio. Ambas tarjetas comparten algunas características técnicas que hacen la comparativa más interesante si cabe, así que antes de comenzar veamos todas sus especificaciones al completo. Características Técnicas Comencemos esta comparativa con su proceso de fabricación, ya que en ambos procesos TSMC es la empresa que se encarga de estos nodos. TSMC ha utilizado tanto en los 16 nm como en los 12 nm el mismo BEOL que en su proceso de 20 nm, pero a favor de los dos primeros se consiguió un aumento de rendimiento entorno al 10-15%. El último proceso de 16 nm para TSMC fue su FFC o FinFET Compact, un nuevo diseño introducido para reducir costos a través de menos máscaras mientras se usa la mitad de potencia. NVIDIA publica cifras de rendimiento de la RTX 2080: hasta el doble de potente que la GTX 1080 en 4K Fue a finales de 2016 cuando TSMC anunció sus 12 nm FFC para así dar el salto a este “nuevo” nodo, donde curiosamente las reglas de diseño son muy similares aunque usan un “paso metálico” más ajustado, lo que proporciona una ligera mejora en la densidad. Este proceso mejorado presenta mejores características de fugas de energía y costos más bajos para la empresa, por lo que es un salto apreciable para NVIDIA entre Pascal y Turing. Diagrama y tamaño de los chips (GP104 vs TU104) #gallery-4 { margin: auto; } #gallery-4 .gallery-item { float: left; margin-top: 10px; text-align: center; width: 50%; } #gallery-4 img { border: 2px solid #cfcfcf; } #gallery-4 .gallery-caption { margin-left: 0; } /* see gallery_shortcode() in wp-includes/media.php */ Como se puede apreciar, la diferencia entre ambos chips es muy considerable, no solo en tamaño (314 vs 553 mm2) sino en transistores incluidos (7200 millones vs 13600 millones) y eso lógicamente repercute en la cantidad de SM que cada uno incluirá finalmente. Las comparaciones son odiosas en este aspecto, ya que el TU104 (RTX 2080) consigue superar la duplicidad de SM frente al GP104 (GTX 1080). Así el primero y más nuevo chip contará con 46 frente a solo los 20 del segundo y ya veterano. ¿Cuánto les cuesta a AMD y NVIDIA fabricar los chips de sus GPU? NVIDIA ha sorprendido a propios y extraños con estas configuraciones, ya que aunque los números son dispares en cuanto a sus Shaders son bastante parejos. Esto es debido a la reducción de su número en los nuevos SM para Turing, ya que en Pascal encontramos que por cada SM teníamos 128 shaders, en cambio para Turing su cifra ha tenido que reducirse hasta los 64 shaders por SM, dando lugar a un sistema más poblado de la unidad mínima de NVIDIA. #gallery-5 { margin: auto; } #gallery-5 .gallery-item { float: left; margin-top: 10px; text-align: center; width: 50%; } #gallery-5 img { border: 2px solid #cfcfcf; } #gallery-5 .gallery-caption { margin-left: 0; } /* see gallery_shortcode() in wp-includes/media.php */ SM Pascal SM Turing RTX No entraremos demasiado en detallar las diferencias en las arquitecturas, pero Turing tiene una serie de cambios arquitectónicos muy amplios, propiciados por otro lado por la arquitectura que existe entre medias de ambas (Volta) y que no vio la luz para tarjetas gaming. Además de implementar nuevos bloques para las unidades principales, en Turing encontramos el Warp Scheduler y el Dispatch Unit en una nueva unidad capaz de ejecutar 32 hilos por ciclo. El archivo de registros ha visto duplicado su capacidad, lo cual era necesario para mantener el ratio en mínimos ciclos y aumentarlo en máximos. Tres motores de renderizado frente a uno En Turing contamos con tres motores totalmente distintos e “independientes”, encargados de tareas específicas en cada ámbito y que son complementarias, donde además se ha añadido como novedad los RT Cores (no presentes en Volta), unidades que calcularán los algoritmos BVH para el trazado de rayos en tiempo real o Ray Tracing. El número de TMUs (unidad de mapeo de texturas) se ha aumentado de 160 a 184 TMU, manteniendo la misma proporción que los Shaders, mientras que los ROPs ( Pipeline de renderizado de salida) se ha mantenido en 64. NVIDIA Max-Q: qué diferencias hay con las tarjetas de escritorio Esto es debido al aumento de Shaders disponible y que necesitaba de un mayor número de estas unidades para poder mantener el número de operaciones de textura de píxeles, siendo más rápido el procesamiento de la información de estas. Al contener el mismo bus para su memoria en ambos casos (256 bits) no es necesario aumentar el número de ROPs disponible y en este aspecto está bien ejecutado por NVIDIA. Por último, la caché L2 ha tenido que ser aumentada debido a un mayor Pixel Fillrate y Texture Fillrate (entre otras cosas) por lo hasta ahora expuesto, de manera que pasamos de 3072 KB a 4096 KB, un 33% de aumento en esta memoria. Velocidad de reloj En este aspecto tenemos que destacar la menor velocidad de serie de la tarjeta con arquitectura Turing, ya que aunque solo les separan 23 MHz bajo Boost, en su base clock encontramos 92 Mhz de diferencia a favor de la tarjeta Pascal GTX 1080. Esto se debe a un control más exhaustivo del consumo y al añadido de más SKU en BIOS para las tarjetas Turing ya que como veremos más adelante el consumo es distinto. En cuanto a su memoria, cada una posee un tipo de memoria distinto y por ello la diferencia de velocidad tan abultada. La GTX 1080 consigue gracias a su GDDR5X 1251 MHz, mientras que la RTX 2080 con su GDDR6 consigue aumentar la cifra hasta los 1750 MHz, una diferencia de clocks de 39,8%. Memoria VRAM Como hemos comentado justo arriba, ambas tarjetas portan dos versiones diferentes de memoria RAM para tarjetas gráficas (VRAM). La diferencia de velocidad implica dos ancho de banda distintos a mismo bus (256 bits) ya que la GTX 1080 consigue 320 GB/s mientras que la RTX 2080 eleva la cifra hasta los 448 GB/s, lo que repercute en ese casi 40% de mayor rendimiento para la última. GDDR6 vs GDDR5: la diferencia de precio se dispara para NVIDIA Este es un punto importante a tratar, ya que mayor velocidad de VRAM implica, como ya hemos visto, un aumento de cachés y un mayor rendimiento de los Shaders y motores en general. El rendimiento de la VRAM ha crecido un 39,8% mientras que el tamaño de la caché ha aumentado un 33,3%, lo que hace una proporción más que correcta para poder manejar la mayor cantidad de datos que ello implica. Consumo y conectores de alimentación   La GTX 1080 era una tarjeta con un consumo algo por encima de la media entre gamas, ya que con 180 vatios se sitúa en un punto cómodo en cuanto a energía y calor se refiere. En contra, la RTX 2080 eleva su consumo hasta los 225 vatios, debido sobre todo al incremento notable de transistores (+88.8%), donde además ha conservado unas frecuencias en Boost casi clavadas como hemos visto. A favor, el proceso de 12 nm, un die de mayor tamaño y un mejor control de energía permiten que el consumo solo se vea incrementado un 25%. Por ello la RTX 2080 se ve forzada a la utilización de dos conectores de alimentación (6+8 pines) mientras que la GTX 1080 se mueve cómodamente con un único conector de 8 pines. RT Cores y Tensor Cores En este apartado poco podemos decir, ya que la GTX 1080 con arquitectura Pascal no ofrece ninguna de las dos unidades que Turing si incluye, para ser concretos: 46 RT Cores y 368 Tensor cores. Solo recordar que los RT Cores son los encargados de trabajar los algoritmos BVH para el trazado de rayos mientras que los Tensor Cores se encargarán del apartado de inteligencia artificial relacionado con el nuevo Deep Learning Super Sampling o DLSS. Rendimiento Uno de los apartados más importantes sin duda, más si cabe después de tanta teoría. Empecemos por su rendimiento teórico en FP32, ya que tanto AMD como NVIDIA ofrecen este dato como punta de lanza en sus presentaciones debido al uso normal en juegos y otras tareas. Así, la GTX 1080 logra aproximadamente 8,8 TFLOPs por 10 TFLOPs de la RTX 2080, esto supone un aumento de rendimiento del 13,63%. Para hacer una comparación justa donde ambas tarjetas se mueven como pez en el agua y a modo de práctica, usaremos Fire Strike Ultra para minimizar el impacto que genera la CPU en test como TimeSpy ya en DX12. #gallery-6 { margin: auto; } #gallery-6 .gallery-item { float: left; margin-top: 10px; text-align: center; width: 50%; } #gallery-6 img { border: 2px solid #cfcfcf; } #gallery-6 .gallery-caption { margin-left: 0; } /* see gallery_shortcode() in wp-includes/media.php */ GTX 1080 RTX 2080 Como se puede ver, esta diferencia de TFLOPs no se ve reflejada en el rendimiento real, ya que la diferencia pasa del 13,63% a un más abultado 25% si tomamos el Graphic Score de ambos test. Precio Ateniéndonos a los precios de salida para ambas gráficas en el momento de su presentación veremos que la GTX 1080 se lanzó a un costo de 699 dólares, mientras que la RTX 2080 ha sido presentada en una cifra mayor de 799 dólares. Esto significa un aumento del 14,3% entre GPUs de la misma gama y donde como ya hemos dicho, obtendríamos un aumento de rendimiento en el mejor escenario de hasta un 25%.