NVIDIA RTX 2060 vs GTX 1060 6 GB, diferencias en la arquitectura y rendimiento: ¿merece la pena el cambio?

Escrito por Javier (Javisoft) López

La gama media es sin duda la gama más atractiva por el ratio precio/prestaciones de todas las GPU en el mercado, donde además se une un consumo contenido. Visto que las ventas de las tres NVIDIA RTX de gama alta no van como se esperaba, la RTX 2060 debería salvar a la compañía de unos números negativos, pero ¿merece la pena el salto desde su homóloga GTX 1060?

NVIDIA RTX 2060 vs GTX 1060 6GB ¿un relevo justificado?

GeForce-GTX-1060

Normalmente la salida de una nueva GPU que sustituye en gama y modelo a la anterior supone un salto de rendimiento, pero la experiencia nos dice que muchas veces el relevo tomado no es suficiente para el desembolso.

¿Cómo ser objetivos a la hora de valorar si está justificado el cambio? Lo primero que necesitamos saber son sus características técnicas a fondo, entenderlas y compararlas, para luego poder discernir si el rendimiento ofrecido se ajusta a lo que ofrece cada una de ellas.

Dicho esto, conozcamos sus características técnicas a fondo para comenzar con este artículo.

Características técnicas

GTX-1060-6-GB-vs-RTX-2060-specs

Gran parte de lo que puede ofrecer cada chip depende en gran manera del proceso litográfico en el que haya sido concebido. En este caso encontramos un proceso de 16 nm en la tarjeta Pascal frente a los 12 nm que obtiene la tarjeta Turing, ambos fabricados por TSMC.

Como ya comentamos en otros artículos, en ambos procesos litográficos TSMC utilizó el mismo BEOL que usó en sus 20 nm, donde en el paso inferior se consiguió entre un 10% y un 15% de rendimiento extra.

Los 16 nm empleados en las tarjetas Pascal son FinFET Compact, un nuevo diseño y matriz para reducir costos frente a lo visto anteriormente, usando la mitad de potencia.

Los 12 nm en cambio son bastante parecidos a los 16 nm, usando para ello un paso metálico inferior y con ello una mejora de la densidad por mm2, aunque bastante leve.

Diagrama y tamaño de los chips (GP106-400-A1 vs TU106-200-KA-A1)

En este punto hay que matizar varios apartados. El primero es que hay varias versiones de ambos chips, por eso en el título superior se han especificado correctamente.

En el caso de la GTX 1060 6 GB y su GP106-400-A1 encontraremos una versión más recortada del mismo en las versiones de la tarjeta que porten 3 GB de RAM y por lo tanto será otra variante distinta al nombrado.

En cambio, la tarjeta Turing porta el TU106 que comparte con el modelo superior, sólo que limitado.

Por ello, la versión usada es la TU106-200-KA-A1 y no la 400 como la RTX 2070.

Aunque los diagramas arriba mostrados no están lógicamente a escala, podemos hacernos una idea del potencial que encierra una tarjeta y otra, sobre todo por el hecho de que la GTX 1060 6 GB apenas incluye 10 SM por los 30 SM de la RTX 2060.

Evidentemente, esto no se traduce en el triple de potencia, ya que apenas se ha duplicado el número de transistores (4400 millones frente a 10800 millones, un +145%) y con ellos el tamaño de los die (200 mm2 frente a 445 mm2, un +122.5%).

Los SM tal y como se ven justamente arriba, son bastante distintos, donde los mayores cambios pasan por la simplificación en los Shaders que albergan.

En Pascal teníamos 128 Shaders por SM, dato que se ha reducido a 64 en Turing, principalmente debido a que ahora contaremos con tres motores distintos: INT32/FP32, Tensor Cores (240) y RT Cores (30), donde Pascal no disponía de estos dos últimos.

Pascal_vs_Turing

Por si fuera poco, los RT Core también se han incluido dentro de los SM, por lo que el cambio es realmente revolucionario en este sentido.

Existen más cambios arquitectónicos, como por ejemplo la inclusión en un solo concepto de los Warp Scheduler junto con Dispatch, pudiendo realizar hasta 32 operaciones por clock.

Como en cada salto de arquitectura, la caché L2 se ha visto aumentada, en este caso a más del doble (1.5 MB frente a 4 MB), lo cual es necesario si queremos trazado de rayos en tiempo real, datos que veremos más adelante.

Centrándonos en otras unidades, estas se han visto bastante potenciadas, ya que por ejemplo pasamos de los 80 TMUs hasta los 120 en la RTX 2060, pero donde curiosamente se mantienen las unidades de rasterización en 48.

BVH

Esto se explica desde el punto de vista de las necesidades del trazado de rayos o Ray Tracing, dado que el procesamiento de los rayos no es “puro” sino un renderizado híbrido donde los RT Cores calcularán los algoritmos BVH y el resto del proceso se tornarán en las unidades de INT32 y FP32, dejando los Tensor Cores destinados en exclusiva para DLSS.

Esto supone una carga de trabajo extra que no solo se solventa con un mayor número de Shaders, sino con mayores unidades de mapeo de texturas o TMU, ya que su función es precisamente esta, aplicar texturas a los píxeles.

Pero ¿entonces por qué no se han aumentado los ROPs?

Turing-Ray-Tracing-RT-Cores

Es una pregunta que debería ser respondida por NVIDIA, ya que las unidades de renderización, aunque no fundamentales en todos los casos, si son necesarias para realizar métodos de antialiasing como MSAA etc … o simplemente dar lugar a la rasterización.

Lo que creemos es que los 48 ROPs que incorpora permiten una asignación óptima de los transistores para las cargas de trabajo, dado que NVIDIA espera que el resto de unidades puedan trabajar a tiempo, donde al mismo tiempo no se desperdician recursos como la memoria o cachés.

Cada GPC tendrá disponibles 16 ROPs y 40 TMUs, lo que nos da una proporción de 2,5 TMUs por cada ROP, muy lejos de los 1.6 que porta la tarjeta Pascal.

Esta técnica la ha mantenido NVIDIA en toda la gama RTX, aumentando los TMUs pero respetando los ROPs incluido en su serie anterior, lo cual evidencia que no es un movimiento para una sola tarjeta, sino para toda la arquitectura.

El aumento de Shaders también empuja a este hecho sin duda, ya que de una tarjeta a otra se han añadido un 50% más de núcleos, por lo que es comprensible el movimiento de NVIDIA.

También es cierto que al mantener el mismo bus de 192 bits los requerimientos de ROPs también se ven contenidos, aunque el ancho de banda si se ha aumentado debido a la diferencia de velocidad en sus VRAM, producida por la nueva tecnología GDDR6.

Velocidad de reloj y caché L2

Turing-Caché-jerarquía

La velocidad ha pasado de 8000 MHz efectivos a 14000 MHz, un 75% más de velocidad real, lo que se ha traducido en una diferencia de ancho de banda del mismo porcentaje (192 GB/s frente a 336 GB/s), debido a que comparten tamaño de bus ( y además capacidad total, 6 GB) como hemos comentado antes.

Esto también ha impulsado un aumento de la caché L2, que junto al aumento de Shaders y TMUs era totalmente necesario.

Y es que de la GTX 1060 6 GB a la RTX 2060 se ha aumentado en un espectacular 66% (1536 KB frente a 4096 KB) ayudando a canalizar la información hacia los núcleos y la L1.

Uno de los puntos donde la RTX 2060 no consigue superar a la GTX 1060 6 GB es en sus clocks, ya que la primera porta unas velocidades de 1365 MHz para su base y 1680 MHz con su Turbo, mientras que la segunda logra, 1506 MHz y 1709 MHz respectivamente.

Esto significa un -9.36% en su frecuencia base y un -1,69% en modo Turbo en favor de la tarjeta Pascal.

Rendimiento

Turing-vs-Pascal-rendimiento

Llegamos al apartado final y que debe de mostrar las diferencias entre una tarjeta y otra.

Primero comencemos con los datos oficiales y teóricos que ofrece NVIDIA para sus dos tarjetas. La GTX 1060 6 GB es capaz de alcanzar 4,375 TFLOPS, mientras que la RTX 2060 se impulsa hasta los 6,451 TFLOPS, una diferencia teórica entre ellas de un 47%.

¿Se traducirá realmente bajo un benchmark de máxima categoría y bien optimizado como Time Spy dicha cifra? Vamos a verlo.

Como se puede apreciar, los Graphics Score dejan muy clara la diferencia entre una tarjeta y otra: un espectacular 65% a favor de la tarjeta basada en Turing.

Precio

NVIDIA-RTX-2060-02

Actualmente y todavía, la GTX 1060 6 GB se puede conseguir en tiendas a un precio recortado muy atractivo, para ser más concretos casi la mitad de lo que cuesta actualmente una RTX 2060, pero esto se debe a ofertas para terminar con el stock existente de la primera.

Pero en este artículo comparemos los precios de salida para ambas tarjetas, así podremos valorar mejor si el aumento de rendimiento compensa con lo ofrecido en su día en la tarjeta anterior.

La GTX 1060 6 GB fue lanzada a un precio de 299 dólares, mientras que la RTX 2060 ha sido presentada a un mayor precio de 349 dólares.

Esto supone un 16% de aumento en el precio en el momento de ambas salidas, por lo que con el salto de rendimiento que existe, el soporte para Ray Tracing y DLSS, la RTX 2060 es una tarjeta mucho más completa y con un mejor ratio rendimiento/precio.

Continúa leyendo