¿Es el nuevo driver de NVIDIA una solución o solo tapa los problemas?

Con la revisión 465.55 del driver de NVIDIA, han intentado resolver los problemas iniciales de las RTX 3080 y RTX 3090 que han aparecido entre algunos de los primeros modelos de tarjetas gráficas vendidos y que tanta polémica han suscitado en los últimos días. Hasta el punto en que los diferentes fabricantes de las tarjetas gráficas y la propia NVIDIA han tenido que salir a dar una respuesta. Pero ¿qué hay detrás de la solución de los nuevos drivers de los de Huang? Os lo explicamos.

Hace unos días NVIDIA lanzo una actualización de sus drivers, la 465.55, la cual parece que habría solventado los problemas de cuelgues de las RTX 3080 y las RTX 3090, mientras tanto, los rumores y explicaciones de los fabricantes por los capacitadores seguía danto de qué hablar.

¿Son los drivers la solución? ¿se requiere un cambio de condensadores?

Resumen rápido de los cambios producidos por el nuevo driver de NVIDIA

Algunos modelos de las RTX 3080 y las RTX 3090 sufrían por lo general un problema llamado CTD (Crash to Desktop), y todo apuntaba a una causa común y es que los condensadores montados en las tarjetas parecen no ser los más adecuados para funcionar en ciertos escenarios.

Pero eso solo era una parte de la historia, la otra parte tiene que ver con la falta de mejores controles de calidad por parte de NVIDIA para que los fabricantes pudieran testear el funcionamiento adecuado de las tarjetas gráficas en el proceso de diseño.

Esta carencia de unos buenos controladores en un inicio es lo que ha llevado a una serie de errores, los cuales han sido maximizados por el «correveydile» de Internet.

Con tal de solventar el problema que hacía que en mitad de la acción los juegos se cerrasen de golpe y se volviese al escritorio, el llamado CTD (Crash to Desktop), NVIDIA lo que ha hecho es cambiar el control del consumo energético de las gráficas que realiza el controlador, lo que ha llevado a algunos cambios leves en el funcionamiento de estas.

Respecto a las velocidades de reloj estándar de las gráficas, NVIDIA no las ha recortado por lo que en su uso normal y sin subidas de velocidad forzadas los nuevos controladores no suponen una pérdida. Eso sí, se ha perdido la posibilidad de alcanzar velocidades de reloj mucho más altas en el proceso, por lo que ya no es posible, en teoría, llevar la GPU muy al norte.

La telemetría en la GPU

Todos los procesadores contemporáneos, independientemente de cuál sea su función, suelen llevar consigo un chip de control, el SMU, el cual es un sistema que monitoriza el voltaje, la temperatura y demás elementos similares para asegurarse el correcto funcionamiento y alargar la vida del mismo.

El caso es que cuando un procesador alcanza unos consumos y una temperatura que se consideran peligrosos para su integridad es cuando dicho chip de control actúa bajando la velocidad e incluso parando por completo el procesador si resultara necesario. Pero el SMU no funciona realmente de manera autónoma, sino que depende de una serie de parámetros limite que son asignados por el controlador de la gráfica.

SMU driver nvidia

Es precisamente el SMU, el que es consultado por parte de soluciones de medición por hardware como el PCAT (Power Capture Analysis Tool) de la propia NVIDIA y GPU-Z con tal de conocer la información de la situación de la GPU en cada momento. Pero puede haber un retardo entre la información que les llega realmente por parte de la SMU y la que ha producido el cuelgue en la propia gráfica, ya que el chip puede fluctuar muy rápidamente de velocidad.

Por ejemplo, puede ocurrir que el GPU-Z nos dé una información de que el cuelgue se ha producido en el segundo pico de velocidad más alto pero dicha información es errónea, porque en ese tiempo de diferencia la GPU ha alcanzado la velocidad limite y la SMU ha realizado la función en ese intervalo.

En cambio, el driver de la gráfica recibe la información a tiempo real y actualizada de la situación de la GPU en cada momento, es por eso que un mal driver puede ser peligroso, porque si no sabe manejar bien la información la gráfica puede tener problemas en ciertas circunstancias. Es él el que tiene toda la autoridad a la hora de medir la telemetría del consumo, ya que el chip de control esta supeditado al controlador.

¿Qué es lo que realmente ha hecho NVIDIA con el nuevo driver?

Simple y llanamente ha hecho que la GPU no pueda alcanzar las velocidades de reloj pico, cuyo consumo energético resultan peligrosos para la estabilidad de la gráfica. Hay que tener en cuenta que para alcanzar velocidades de reloj muy altas es necesario aumentar el voltaje, lo que tiene como consecuencias el aumento del consumo energético.

Realmente, lo que ha conseguido es una curva de voltaje y frecuencia más baja en todos sus puntos, pero sobre todo en el final de la misma, que es la parte de mayor estrés para el chip.

La forma más fácil de conseguir que se alcance un consumo energético peligroso no es limitando de manera directa las velocidades de reloj, sino el consumo total máximo y NVIDIA por lo visto solo lo ha recortado unos 4 W en las RTX 3080, pero hablar en estos términos es simplificar demasiado.

El sistema de telemetría de la gráfica es el que tiene en su interior las velocidades de reloj adecuadas, sus voltajes asociados y que límites de consumo tiene la gráfica. Estos valores son cambiados continuamente con los nuevos controladores y se apoyan en las SKU de las BIOS para ofrecer los valores correctos de voltaje y frecuencias.

¿Es mejor el nuevo driver que el anterior de cara al rendimiento de los juegos?

Witcher3 old driver nvidia

Existe una controversia por lo visto, donde en algunos sitios se comenta que los nuevos drivers dan un mejor rendimiento, mientras que en otros se dice que el escenario es justo el contrario.

Si miramos las pruebas de rendimiento que se han realizado en algunos sitios comparando el rendimiento entre el nuevo y el viejo driver de NVIDIA veremos que no hay una perdida sustancial de FPS en el uso normal de las RTX 3080 y las RTX 3090.

Por lo que para el usuario medio no resultan en una pérdida de rendimiento, pero para los amantes de hacer overclocking extremo se han encontrado con que ahora las velocidades de reloj extremas se han visto limitadas, por lo que las cifras serán en este caso más bajas a partir de ahora con este nuevo driver de NVIDIA.