Desmitificando al DLSS de NVIDIA, ¿por qué no es la panacea en GPUs?

Desmitificando al DLSS de NVIDIA, ¿por qué no es la panacea en GPUs?

Redacción

El DLSS es una de las puntas de lanza de NVIDIA frente a AMD, los juegos que lo soportan pueden alcanzar mayores tasas de fotogramas a resoluciones de salida donde sin el uso de esta técnica no sería posible. Este hecho ha sido el que ha convertido a las GPUs de las gamas RTX de NVIDIA en las actuales líderes del mercado de las GPUs, pero el DLSS de NVIDIA tiene trampa y os vamos a contar cuál es.

Si tenemos que hablar de las dos puntas de lanza de NVIDIA para sus GeForce RTX está claro que son el Ray Tracing y el DLSS, el primero ha dejado de ser ventaja por la implementación en las RDNA 2 de AMD, pero el segundo sigue siendo un elemento diferencial que le da una gran ventaja, pero no todo es lo que parece a primera vista.

El DLSS en las RTX depende de los Tensor Cores

Lo primero que tenemos que tener en cuenta es como los diferentes algoritmos, llamados comúnmente DLSS, aprovechan el hardware de la consola y nada mejor que hacer un análisis del funcionamiento de la GPU mientras está renderizando un fotograma con el DLSS activo y sin este.

Las dos capturas de pantalla que tenéis arriba de estas imágenes corresponden al uso de la herramienta NVIDIA NSight, la cual mide el uso de cada una de las partes de la GPU a través del tiempo. Para interpretar las gráficas hemos de tener en cuenta que el eje vertical corresponde al nivel de uso de esa parte de la GPU y el eje horizontal el tiempo en el que se renderiza el fotograma.

Como se puede ver, la diferencia entre ambas capturas de pantalla del NSight es que en una de ellas se puede ver el nivel de uso de cada parte de la GPU al utilizar el DLSS y en la otra no. ¿Cuál es la diferencia? Si no fijamos bien veremos que en la correspondiente al uso del DLSS la gráfica correspondiente a los Tensor Cores esta plana excepto al final de la gráfica, que es cuando estas unidades se activan.

El DLSS no es otra cosa que un algoritmo de superresolución, que toma una imagen a una resolución de entrada determinada y saca en el proceso una versión de la misma imagen a más resolución. Es por eso que los Tensor Cores al aplicarlo se activan al final, ya que requieren que la GPU renderice la imagen primero.

Funcionamiento del DLSS en las NVIDIA RTX

RTX 3070 3080 Ti

El DLSS toma hasta 3 milisegundos del tiempo para renderizar un fotograma, independientemente de cuál sea la velocidad de estos a la que funciona el juego. Si por ejemplo queremos aplicar el DLSS en los juegos a una frecuencia de 60 Hz, entonces la GPU deberá resolver cada fotograma en:

(1000 ms/60 Hz) -3 ms.

Dicho de otra manera, en 13.6 ms, a cambio vamos a obtener una tasa de fotogramas más alta en la resolución de salida que obtendríamos si pusiéramos a renderizar a la GPU de manera nativa dicha resolución de salida.

DLSS Ejemplo funcionamiento

Suponed que tenemos una escena que queremos renderizar a 4K. Para ello tenemos una GeForce RTX indeterminada que a dicha resolución alcanza los 25 fotogramas por segundo, por lo que renderiza cada uno de estos a 40 ms, sabemos que la misma GPU puede alcanzar a 1080p una tasa de fotogramas de 5o, 20 ms. Nuestra hipotética GeForce RTX tarda unos 2.5 ms en escalar de los 1080p a los 4K, por lo que si activamos el DLSS para obtener una imagen 4K a partir de una a 1080p entonces cada fotograma con DLSS tardará 22.5 ms. Con ello hemos obtenido renderizar la escena a 44 fotogramas por segundo, lo cual es mayor que los 25 fotogramas que se obtendrían renderizando a resolución nativa.

Por otro lado, si la GPU va a tardar más de 3 milisegundos en hacer el salto de resolución entonces el DLSS no se activará, ya que es el límite de tiempo marcado por NVIDIA en sus GPUs RTX para que estas apliquen los algoritmos DLSS. Esto hace que las GPUs de gama más baja tengan limitada la resolución a la que pueden ejecutar el DLSS.

EL DLSS se beneficia de la alta velocidad de los Tensor Cores

Los Tensor Cores son esenciales para la ejecución del DLSS, sin ellos no se podría realizar a la velocidad que se ejecuta en las NVIDIA RTX, ya que el algoritmo utilizado para realizar el aumento de resolución es lo que llamamos una red neuronal convolucional, en cuya composición no vamos a entrar en este artículo, solo decir que estas utilizan una gran cantidad de multiplicaciones de matrices y las unidades tensor son ideales para el cálculo con matrices numéricas, ya que son el tipo de unidad que más rápido las ejecuta.

En el caso de una película hoy en día los descodificadores acaban generando la imagen inicial en el búfer de imagen varias veces más rápido que la tasa en la que se muestra en pantalla, por lo que a la hora de escalar hay más tiempo y por tanto se acaba necesitando una potencia de cálculo mucho menor. En un videojuego en cambio no tenemos almacenada en un soporte como será la siguiente imagen, sino que se ha de generar por la GPU, esto recorta el tiempo que tiene el escalador para funcionar.

Ampere SM Subcore

Cada uno de estos Tensor Cores se encuentra en el interior de cada unidad SM y según la tarjeta gráfica que estemos utilizando su capacidad de cálculo variará, al variar el número de SMs por GPU, y por tanto generará la imagen escalada en más menos tiempo. Debido a que el DLSS se activa al final del renderizado se necesita una gran velocidad para aplicar el DLSS, es por ello que es diferente a los otros algoritmos de superresolución como los que se utilizan para escalar películas e imágenes.

No todas las RTX de NVIDIA rinden igual en DLSS

Tabla Rendimiento DLSS

Esta tabla que veis esta sacada de la documentación de la propia NVIDIA, donde la resolución de entrada en todos los casos tiene 4 veces menos la resolución de salida, por lo que estamos en el Performance Mode. Hay que aclarar que existen dos modos adicionales, el Quality Mode da mejor calidad de imagen, pero requiere una resolución de entrada de la mitad de píxeles, mientras que el Ultra Performance Mode hace un escalado de 9 veces, pero tiene la peor calidad de imagen de todas.

Como se puede ver en la tabla el rendimiento no solo varía según la GPU, sino también si tenemos en cuenta la GPU que estamos utilizando. Lo cual no debería sorprender a nadie después de lo que hemos explicado con anterioridad. El hecho que en el Performance Mode una RTX 3090 acabe consiguiendo escalar de 1080p a 4K en menos de 1 ms es cuanto menos impresionante, no obstante esto tiene una contrapartida que se deriva de una conclusión lógica y es que el DLSS en las tarjetas gráficas más modestas va a funcionar peor siempre.

La causa detrás de ello es clara, una GPU con menor potencia no solo va a necesitar más tiempo para renderizar el fotograma, sino incluso para aplicar el DLSS. ¿Es la solución el modo Ultra Performance que aumenta la cantidad de píxeles en 9 veces? No, desde el momento en que el DLSS requiere que la imagen de salida tenga suficiente resolución de entrada, ya que cuanto más píxeles haya en pantalla entonces habrá más información y el escalado será más preciso.

Geometría, calidad de imagen y DLSS

Fragmentos DLSS

Las GPU están pensadas para que en la etapa del Pixel/Fragment Shader, en la que se da color a los píxeles de cada fragmento y se aplican las texturas, lo hagan con fragmentos de 2×2 píxeles. La mayoría de GPUs cuando han rasterizado un triangulo lo convierten en un bloque de píxeles que luego es subdividido en bloques de 2×2 píxeles, donde cada bloque es enviado a una Compute Unit.

¿Las consecuencias sobre el DLSS? La unidad de rasterizado suele descartar de entrada todos los fragmentos de 2×2 de tamaño por ser demasiado pequeños, a veces correspondientes a detalles que se encuentran en la lejanía. Esto se traduce en que detalles que a una resolución nativa se verían sin problemas no se ven en la resolución obtenida a través de DLSS por el hecho que no se encontraban en la imagen a escalar.

Dado que el DLSS requiere una imagen con la mayor información posible como referente de entrada, no se trata de un algoritmo pensado para generar imágenes a muy alta resolución a partir de muy bajas, ya que se pierde detalle en el proceso.

¿Y qué hay de AMD, puede emular el DLSS?

FidelityFX Super Resolution

Los rumores acerca de la superresolución en el FidelityFX hace meses que rondan la red pero desde AMD todavía no nos han dado ningún ejemplo real sobre el funcionamiento de su contrapartida al DLSS. ¿Qué es lo que le está complicando la vida tanto a AMD? Pues el hecho que los Tensor Cores son cruciales para el DLSS y en las AMD RX 600 no existen unidades equivalentes, sino que se utiliza SIMD sobre registro o SWAR en las ALUs de las Compute Units para obtener un mayor rendimiento en FP16 formatos de menor precisión, pero una unidad SIMD no es un array sistólico o unidad tensor.

De entrada, estamos hablando de un diferencial de 4 veces a favor de NVIDIA, esto significa que a la hora de generar una solución similar parte de una desventaja de velocidad considerable, optimizaciones para el cálculo de matrices aparte. No estamos discutiendo si NVIDIA es mejor que AMD en esto, sino del hecho que AMD a la hora de diseñar sus RDNA 2 no le dio importancia a las unidades tensor.

CDNA Compute Unit

¿Es por incapacidad? Pues no, ya que paradójicamente AMD si que las ha añadido en CDNA bajo el nombre de Matrix Core. Por el momento es pronto para hablar de RDNA 3, pero esperemos que AMD no cumpla otra vez el mismo error de no incluir una de estas unidades. No tiene sentido prescindir de ellas cuando el coste por Compute Unit o SM es de solo 1 mm2.

Por lo que esperamos que cuando AMD añada su algoritmo por la falta de las unidades Tensor no alcance la precisión y tampoco la velocidad del de NVIDIA, pero que AMD presente una solución más simple como puede ser un Performance Mode que duplique los píxeles en pantalla.

15 Comentarios
Logo hardzone.es
Navega gratis con cookies…

Navegar por hardzone.es con publicidad personalizada, seguimiento y cookies de forma gratuita. i

Para ello, nosotros y nuestros socios i necesitamos tu consentimiento i para el tratamiento de datos personales i para los siguientes fines:

Las cookies, los identificadores de dispositivos o los identificadores online de similares características (p. ej., los identificadores basados en inicio de sesión, los identificadores asignados aleatoriamente, los identificadores basados en la red), junto con otra información (p. ej., la información y el tipo del navegador, el idioma, el tamaño de la pantalla, las tecnologías compatibles, etc.), pueden almacenarse o leerse en tu dispositivo a fin de reconocerlo siempre que se conecte a una aplicación o a una página web para una o varias de los finalidades que se recogen en el presente texto.

La mayoría de las finalidades que se explican en este texto dependen del almacenamiento o del acceso a la información de tu dispositivo cuando utilizas una aplicación o visitas una página web. Por ejemplo, es posible que un proveedor o un editor/medio de comunicación necesiten almacenar una cookie en tu dispositivo la primera vez que visite una página web a fin de poder reconocer tu dispositivo las próximas veces que vuelva a visitarla (accediendo a esta cookie cada vez que lo haga).

La publicidad y el contenido pueden personalizarse basándose en tu perfil. Tu actividad en este servicio puede utilizarse para crear o mejorar un perfil sobre tu persona para recibir publicidad o contenido personalizados. El rendimiento de la publicidad y del contenido puede medirse. Los informes pueden generarse en función de tu actividad y la de otros usuarios. Tu actividad en este servicio puede ayudar a desarrollar y mejorar productos y servicios.

La publicidad que se presenta en este servicio puede basarse en datos limitados, tales como la página web o la aplicación que esté utilizando, tu ubicación no precisa, el tipo de dispositivo o el contenido con el que está interactuando (o con el que ha interactuado) (por ejemplo, para limitar el número de veces que se presenta un anuncio concreto).

  • Un fabricante de automóviles quiere promocionar sus vehículos eléctricos a los usuarios respetuosos con el medioambiente que viven en la ciudad fuera del horario laboral. La publicidad se presenta en una página con contenido relacionado (como un artículo sobre medidas contra el cambio climático) después de las 18:30 h a los usuarios cuya ubicación no precisa sugiera que se encuentran en una zona urbana.
  • Un importante fabricante de acuarelas quiere realizar una campaña publicitaria en Internet para dar a conocer su última gama de acuarelas con la finalidad de llegar tanto a artistas aficionados como a profesionales y, a su vez, se evite mostrar el anuncio junto a otro contenido no relacionado (por ejemplo, artículos sobre cómo pintar una casa). Se detectará y limitará el número de veces que se ha presentado el anuncio a fin de no mostrarlo demasiadas veces.

La información sobre tu actividad en este servicio (por ejemplo, los formularios que rellenes, el contenido que estás consumiendo) puede almacenarse y combinarse con otra información que se tenga sobre tu persona o sobre usuarios similares(por ejemplo, información sobre tu actividad previa en este servicio y en otras páginas web o aplicaciones). Posteriormente, esto se utilizará para crear o mejorar un perfil sobre tu persona (que podría incluir posibles intereses y aspectos personales). Tu perfil puede utilizarse (también en un momento posterior) para mostrarte publicidad que pueda parecerte más relevante en función de tus posibles intereses, ya sea por parte nuestra o de terceros.

  • En una plataforma de redes sociales has leído varios artículos sobre cómo construir una casa en un árbol Esta información podría añadirse a un perfil determinado para indicar tuinterés en el contenido relacionado con la naturaleza, así como en los tutoriales de bricolaje (con el objetivo de permitir la personalización del contenido, de modo que en el futuro, por ejemplo, se te muestren más publicaciones de blogs y artículos sobre casas en árboles y cabañas de madera).
  • Has visualizado tres vídeos sobre la exploración espacial en diferentes aplicaciones de televisión. Una plataforma de noticias sin relación con las anteriores y con la que no has tenido contacto en el pasado crea un perfil basado en esa conducta de visualización marcando la exploración del espacio como un tema de tu posible interés para para otros vídeos.

El contenido que se te presenta en este servicio puede basarse en un perfilde personalización de contenido que se haya realizado previamente sobre tu persona, lo que puede reflejar tu actividad en este u otros servicios (por ejemplo, los formularios con los que interactúas o el contenido que visualizas), tus posibles intereses y aspectos personales. Un ejemplo de lo anterior sería la adaptación del orden en el que se te presenta el contenido, para que así te resulte más sencillo encontrar el contenido (no publicitario) que coincida con tus intereses.

  • Has leído unos artículos sobre comida vegetariana en una plataforma de redes sociales. Posteriormente has usado una aplicación de cocina de una empresa sin relación con la anterior plataforma. El perfil que se ha creado sobre tu persona en la plataforma de redes sociales se utilizará para mostrarte recetas vegetarianas en la pantalla de bienvenida de la aplicación de cocina.
  • Has visualizado tres vídeos sobre remo en páginas web diferentes. Una plataforma de video, no relacionada con la página web en la que has visualizado los vídeos sobre remo, pero basandose en el perfil creado cuando visistaste dicha web, podrá recomendarte otros 5 vídeos sobre remo cuando utilices la plataforma de video a través de tu televisor .

La información sobre qué publicidad se te presenta y sobre la forma en que interactúas con ella puede utilizarse para determinar lo bien que ha funcionado un anuncio en tu caso o en el de otros usuarios y si se han alcanzado los objetivos publicitarios. Por ejemplo, si has visualizado un anuncio, si has hecho clic sobre el mismo, si eso te ha llevado posteriormente a comprar un producto o a visitar una página web, etc. Esto resulta muy útil para comprender la relevancia de las campañas publicitarias./p>

  • Has hecho clic en un anuncio en una página web/medio de comunicación sobre descuentos realizados por una tienda online con motivo del “Black Friday” online y posteriormente has comprado un producto. Ese clic que has hecho estará vinculado a esa compra. Tu interacción y la de otros usuarios se medirán para saber el número de clics en el anuncio que han terminado en compra.
  • Usted es una de las pocas personas que ha hecho clic en un anuncio que promociona un descuento por el “Día de la madre”de una tienda de regalos en Internet dentro de la aplicación de una web/medio de comunicación. El medio de comunicación quiere contar con informes para comprender con qué frecuencia usted y otros usuarios han visualizado o han hecho clic en un anuncio determinado dentro de la aplicación y, en particular, en el anuncio del “Día de la madre” para así ayudar al medio de comunicación y a sus socios (por ejemplo, las agencias de publicidad) a optimizar la ubicación de los anuncios.

La información sobre qué contenido se te presenta y sobre la forma en que interactúas con él puede utilizarse para determinar, por ejemplo, si el contenido (no publicitario) ha llegado a su público previsto y ha coincidido con sus intereses. Por ejemplo, si hasleído un artículo, si has visualizado un vídeo, si has escuchado un “pódcast” o si has consultado la descripción de un producto, cuánto tiempo has pasado en esos servicios y en las páginas web que has visitado, etc. Esto resulta muy útil para comprender la relevancia del contenido (no publicitario) que se te muestra.

  • Has leído una publicación en un blog sobre senderismo desde la aplicación móvil de un editor/medio de comunicación y has seguido un enlace a una publicación recomendada y relacionada con esa publicación. Tus interacciones se registrarán para indicar que la publicación inicial sobre senderismo te ha resultado útil y que la misma ha tenido éxito a la hora de ganarse tu interés en la publicación relacionada. Esto se medirá para saber si deben publicarse más contenidos sobre senderismo en el futuro y para saber dónde emplazarlos en la pantalla de inicio de la aplicación móvil.
  • Se te ha presentado un vídeo sobre tendencias de moda, pero tu y otros usuarios habéis dejado de visualizarlo transcurridos unos 30 segundos. Esta información se utilizará para valorar la duración óptima de los futuros vídeos sobre tendencias de moda.

Se pueden generar informes basados en la combinación de conjuntos de datos (como perfiles de usuario, estadísticas, estudios de mercado, datos analíticos) respecto a tus interacciones y las de otros usuarios con el contenido publicitario (o no publicitario) para identificar las características comunes (por ejemplo, para determinar qué público objetivo es más receptivo a una campaña publicitaria o a ciertos contenidos).

  • El propietario de una librería que opera en Internet quiere contar con informes comerciales que muestren la proporción de visitantes que han visitado su página y se han ido sin comprar nada o que han consultado y comprado la última autobiografía publicada, así como la edad media y la distribución de género para cada uno de los dos grupos de visitantes. Posteriormente, los datos relacionados con la navegación que realizas en su página y sobre tus características personales se utilizan y combinan con otros datos para crear estas estadísticas.
  • Un anunciante quiere tener una mayor comprensión del tipo de público que interactúa con sus anuncios. Por ello, acude a un instituto de investigación con el fin de comparar las características de los usuarios que han interactuado con el anuncio con los atributos típicos de usuarios de plataformas similares en diferentes dispositivos. Esta comparación revela al anunciante que su público publicitario está accediendo principalmente a los anuncios a través de dispositivos móviles y que es probable que su rango de edad se encuentre entre los 45 y los 60 años.

La información sobre tu actividad en este servicio, como tu interacción con los anuncios o con el contenido, puede resultar muy útil para mejorar productos y servicios, así como para crear otros nuevos en base a las interacciones de los usuarios, el tipo de audiencia, etc. Esta finalidad específica no incluye el desarrollo ni la mejora de los perfiles de usuario y de identificadores.

  • Una plataforma tecnológica que opera con un proveedor de redes sociales observa un crecimiento en los usuarios de aplicaciones móviles y se da cuenta de que, en funciónde sus perfiles, muchos de ellos se conectan a través de conexiones móviles. La plataforma utiliza una tecnología nueva para mostrar anuncios con un formato óptimo para los dispositivos móviles y con un ancho de banda bajo a fin de mejorar su rendimiento.
  • Un anunciante está buscando una forma de mostrar anuncios en un nuevo tipo de dispositivo. El anunciante recopila información sobre la forma en que los usuarios interactúan con este nuevo tipo de dispositivo con el fin de determinar si puede crear un nuevo mecanismo para mostrar la publicidad en ese tipo de dispositivo.

El contenido que se presenta en este servicio puede basarse en datos limitados, como por ejemplo la página web o la aplicación que esté utilizando, tu ubicación no precisa, el tipo de dispositivo o el contenido con el que estás interactuando (o con el que has interactuado) (por ejemplo, para limitar el número de veces que se te presenta un vídeo o un artículo en concreto).

  • Una revista de viajes, para mejorar las experiencias de viaje en el extranjero, ha publicado en su página web un artículo sobre nuevos cursos que ofrece una escuela de idiomas por Internet. Las publicaciones del blog de la escuela se insertan directamente en la parte inferior de la página y se seleccionan en función de la ubicación no precisa del usuario (por ejemplo, publicaciones del blog que explican el plan de estudios del curso para idiomas diferentes al del país en el que este te encuentras).
  • Una aplicación móvil de noticias deportivas ha iniciado una nueva sección de artículos sobre los últimos partidos de fútbol. Cada artículo incluye vídeos alojados por una plataforma de streaming independiente que muestra los aspectos destacados de cada partido. Si adelantas un vídeo, esta información puede utilizarse para determinar que el siguiente vídeo a reproducir sea de menor duración.

Se puede utilizar la localización geográfica precisa y la información sobre las características del dispositivo

Al contar con tu aprobación, tu ubicación exacta (dentro de un radio inferior a 500 metros) podrá utilizarse para apoyar las finalidades que se explican en este documento.

Con tu aceptación, se pueden solicitar y utilizar ciertas características específicas de tu dispositivo para distinguirlo de otros (por ejemplo, las fuentes o complementos instalados y la resolución de su pantalla) en apoyo de las finalidades que se explican en este documento.

O sin cookies desde 1,67€ al mes

Por solo 1,67€ al mes, disfruta de una navegación sin interrupciones por toda la red del Grupo ADSLZone: adslzone.net, movilzona.es, testdevelocidad.es, lamanzanamordida.net, hardzone.es, softzone.es, redeszone.net, topesdegama.com y más. Al unirte a nuestra comunidad, no solo estarás apoyando nuestro trabajo, sino que también te beneficiarás de una experiencia online sin cookies.