NVIDIA GTX 1660: nueva tarjeta gráfica para sustituir a la GTX 1060, ¿cómo rinde?

La espera ha terminado, el lanzamiento de la NVIDIA GTX 1660 se ha producido y con ello una avalancha de reviews por todo el mundo que ponen a prueba a lo último de los de Huang. Dicha tarjeta viene a ocupar el puesto de la ya veterana GTX 1060 y debería entrar a competir contra la hasta ahora dominadora del mercado RX 590 de AMD ¿conseguirá desbancarla?
Se confirman todas las características para esta GTX 1660
Los datos que llevamos adelantándoos sobre la GTX 1660 se han confirmado en su totalidad, por lo tanto, no habrá sorpresas en este aspecto con la tarjeta de gama media (o media-baja según se mire) de NVIDIA.
En concreto, hablamos de 22 SM en el mismo chip que porta la GTX 1660 Ti, es decir, el TU116 (salvo su versión, TU116-300-A1) y que albergan 1408 Shaders (o CUDA Cores), 88 TMUs y 48 ROPs.
Las frecuencias, tal y como ya vimos, son algo más altas que las de la versión Ti, siendo estas 1530 MHz en base y 1785 MHz en Boost.
En cuanto a su memoria, porta GDDR5 a una velocidad de 2 GHz real u 8 GHz efectiva, con un tamaño total de 6 GB que estarán unidos mediante un bus de 192 bits.
Su consumo es de 120 vatios que será generado en parte gracias a la inclusión de un solo conector de 8 pines.
Por último, su MSPR está fijado en 219 dólares, así que ese debería ser el precio mínimo a la que la encontraremos finalmente.
Como dato, esta NVIDIA GTX 1660 no tendrá modelo de la propia marca, siendo exclusivo de los ensambladores y dejándoles libre elección en tamaños y formas para sus disipadores.
Novedades de la serie 16 frente a las RTX
Para esta serie 16, NVIDIA ha tenido que rediseñar tanto los SM como los GPC de su arquitectura Turing, haciéndolos más básicos y simples por el camino.
Este rediseño prescinde de los RT Cores y de los Tensor Cores, pero mantiene la estructura de GPC. En este caso se han mantenido los 3 GPC, pero se han deshabilitado dos SM completos con su TPC (Texture Processing Cluster) y motor polimórfico correspondiente.
La interfaz PCIe 3.0, su motor GigaThread y su caché L2 son compartidos por los GPC, donde además tenemos que destacar sus seis controladores de memoria de 32 bits.
Cada par de SM (Streaming Multiprocessor) comparte motor polimórfico y TPC, por lo que NVIDIA se ve obligada a prescindir de solo dos de ellos para dar vida a este TU116-300-A1.
Cada SM contiene 64 Shaders o núcleos CUDA, es decir, cada TPC contendrá 128 Shaders y 512 por GPC, para dar un total de 1408 Shaders en esta GTX 1660.
Rendimiento mejorado en FP16 y caché L1 unificada
Una de las mejoras principales de la arquitectura Turing es la posibilidad de ejecutar un mayor número de instrucciones por ciclo, debido principalmente a su capacidad para trabajar en paralelo con enteros y FP.
Esto es algo que, por ejemplo, Pascal no podía hacer, debido principalmente a la ausencia de los tres motores que Turing usa para lograr esta función.
Por si fuera poco, NVIDIA al deshacerse de los Tensor Cores ha incluido en el mismo motor que los ocupaba unidades FP16, que, sin ser la panacea en cuanto a precisión, ayudan a empujar el rendimiento en según qué usos y escenarios, ya que se ejecutan al doble de velocidad que los FP32, aunque sin llegar a la velocidad de los Tensor Cores.
Esta inclusión consigue mejorar los slots de instrucciones dentro de cada juego, donde NVIDIA ya señaló que de cada 100 instrucciones en Shadow of the Tomb Raider una GTX 1660 Ti lograba reducir en un 28% el tiempo de ejecución de cada trama.
Por cada 100 instrucciones se mejoran 38 por parte del motor de enteros, mientras que el motor de punto flotante hace las 62 restantes, obteniendo un mayor rendimiento y mejor optimización general.
Las mejoras en la memoria caché parten desde el aumento de su tamaño, triplicándose frente a Pascal y con un aumento de hasta cuatro veces en su ancho de banda.
Cada grupo de caché L1 está compuesto de 64 KB que pueden dividirse las cargas de trabajo en dos grupos de 32 KB para mejorar la carga y el almacenamiento en los SM y TPC, siendo más efectivos y reduciendo la latencia general entre ellos.
La serie 16 sigue incluyendo VRR (Variable Rate Shading)
Una de las mejoras de Turing frente a Pascal de la que se está hablando últimamente por la patente que AMD lanzó en referente a estas para sus SOC de consola, es VRR o Variable Rate Shading.
Aunque esta serie 16 no dispone de Ray Tracing y DLSS si incluirá la llamada Adaptive Shading o sombra adaptativa o también conocida como VRR (sombra de velocidad variable).
Este tipo de tecnología permite que la imagen sea más nítida en el centro de la acción, dándole prioridad a la representación en pantalla de sus sombras y efectos relativos, mientras que las zonas periféricas quedan en un segundo plano y son trabajadas a continuación.
Esto se logra mediante dos algoritmos clave: CAS y MAS.
El primero (CAS) es el sombreado adaptativo del contenido, el cual detecta el color o la coherencia espacial en las escenas, minimizando el sombreado repetitivo en los detalles y mejorando los que sean importantes.
El segundo (MAS) detecta los movimientos de mayor velocidad de la escena y minimiza los detalles del sombreado para conseguir el mejor rendimiento en todo momento, todo sin perder nitidez.
Rendimiento de la GTX 1660
En cuanto a su rendimiento, al no existir modelo de referencia de NVIDIA, todos los datos que podremos obtener serán de tarjetas de los ensambladores.
Hemos escogido los datos desde TPU bajo una tarjeta gráfica firmada por Zotac, que contiene las mismas frecuencias de stock que NVIDIA fija para sus chips, así podremos hacernos una idea del alcance de su rendimiento.
Las resoluciones usadas son las más comunes: 1080p, 1440p y 2160p.
GTX 1660 Ti bajo 1080p
La nueva tarjeta de NVIDIA consigue superar a su rival más directa en AMD (RX 590 con Polaris 30 XTX) en un 8% y sorprendentemente logra batir a su homóloga en Pascal (GTX 1060 6 GB) por un sorprendente 26%.
En cambio, la distancia contra su hermana mayor (GTX 1660 Ti) se establece en un 13%.
GTX 1660 bajo 1440p
En 2K las diferencias con su rival en el mercado se reducen a un 6%, pero donde más pierde es frente a la GTX 1060 6 GB, ya que esta logra reducir la brecha hasta un 17%, es decir, esta GTX 1660 ha perdido un 9% al subir la resolución.
En cambio, contra la GTX 1660 Ti la diferencia aumenta un 1%, hasta el 14% en general.
GTX 1660 bajo 2160p
Bajo 4K se corrobora lo visto en 2K: la diferencia contra la RX 590 se reduce a sólo un 3%, la brecha contra la GTX 1060 6 GB se reduce a un 15% y la distancia contra la GTX 1660 Ti se amplía otro 2% hasta llegar a un 15% en total.
Sin duda NVIDIA ha lanzado una magnífica tarjeta a un gran precio, donde en todos los casos se sitúa por delante de su rival en el mercado y donde aun con 2 GB menos de VRAM logra batirla en 4K.
Este movimiento debería ser respondido por parte de AMD con un reajuste de precios en su RX 590 y RX 580, por lo menos hasta la salida de su nueva arquitectura Navi y su serie RX 3000.