¿Por qué la GDDR6X logra más frecuencia en OC que la GDDR6?

¿Por qué la GDDR6X logra más frecuencia en OC que la GDDR6?

Javier López

El lanzamiento de las RTX 3000 ha traído consigo unas mejoras interesantes en su arquitectura, pero también nos ha deleitado con la nueva memoria GDDR6X, una evolución directa de las GDDR6 como VRAM. Mayor frecuencia de serie, más rendimiento y más overclock, pero nadie se pregunta, ¿cómo logran hacerlo? La respuesta la tienen dos algoritmos de nueva hornada como son la detección y la repetición de errores. ¿Qué son y cómo funcionan?

Desde la época de la GDDR5 ha llovido mucho, pero lo cierto es que los fabricantes alcanzaron un gran número de RMA por parte de los usuarios y la mayoría de las tarjetas muertas tenían un factor en común: problemas con la VRAM.

Por ello, tras el nuevo fiasco de la GDDR5X (con ciertos paliativos hemos de decir) el nuevo estándar de VRAM tenía que incluir una serie de características que pudiesen evitar una muerte súbita de la tarjeta cuando se overclockeaba dicha VRAM.

GDDR6, el primer paso para reducir los problemas de memoria bajo overclocking

Micron-GDDR6

El paso de GDDR5X a GDDR6, frecuencias, longitud de bloques o voltajes fuera, trajo consigo varias mejoras en cuanto a durabilidad y protección bajo OC, pero el pequeño salto de GDDR6 a la memoria GDDR6X ha supuesto que NVIDIA se involucre de lleno en mejorar todavía más esto.

La pregunta más obvia es, ¿cómo lo hacen? En primer lugar, tenemos que tener en cuenta que tanto la GDDR6 como la memoria GDDR6X tienen dos canales de X16 o X8 como E/S, pero hay entre ellas tres diferencias clave de las cuales explicaremos dos que son las relativas al mejor overclocking:

  • PAM 4 (Pulse-Amplitude Modulation V4)
  • EDR (Error Detection and Replay)
  • CRC (Cyclic Redundancy Check)

El primero (PAM 4) tiene que ver en gran parte con el aumento de frecuencia de serie entre ambos tipos de memoria, lo cual trataremos en un artículo más adelante y en exclusiva sobre cómo Micron ha conseguido más velocidad en sus memorias GDDR6X.

Pero dejando esta característica básica a un lado, ha sido NVIDIA como decimos la que ha tomado cartas en el asunto y sobre lo que cimienta el mejor overclock de una memoria hasta ahora.

Ampere permite empujar la memoria GDDR6X «sin bloqueos»

Característica GDDR5 GDDR5X GDDR6 GDDR6X
Densidad 512 MB-8 GB 8 GB 8 GB, 16 GB 8 GB, 16 GB
VDD ve VDDQ 1,5 V o 1,35 V 1,35 V 1,35 V o 1,25 V 1,35 V o 1,25 V
VPP 1,8 V 1,8 V 1,8 V
Tasas de transferencia de datos Hasta Gb / s Hasta 12 Gb / s Hasta 16 Gb / s 19 Gb / s, 21 Gb / s,
> 21 Gb / s
número de canales 1 1 2 2
Nivel de acceso 32 bytes 64 bytes
2x 32 bytes (en modo pseudo 32B)
2 canales x 32 bytes 2 canales x 32 bytes
Longitud del bloque de datos 8 16/8 dieciséis 8 (modo PAM4)
16 (módulo RDQS)
Señal POD15 / POD135 POD135 POD135 / POD125 PAM4 POD135 / POD125
Ancho de E / S x32 / x16 x32 / x16 2 canales x16 / x8 2 canales x16 / x8
Valor de la señal 61
– 40 DQ, DBI, EDC
– 15 CA.
– 6 CK, WCK
61
– 40 DQ, DBI, EDC
– 15 CA.
– 6 CK, WCK
70 o 74
– 40 DQ, DBI, EDC
– 24 CA.
– 6 o 10 CK, WCK
70 o 74
– 40 DQ, DBI, EDC
– 24 CA.
– 6 o 10 CK, WCK
PLL, DCC PLL PLL PLL, DCC DCC
CRC CRC-8 CRC-8 2x CRC-8 2x CRC-8
VREFD 2 por byte externo o interno Interno por byte Interna por pin Interna por pin
3 receptores secundarios por pin
Equilibrio RX / TX RX / TX RX / TX
VREFC Externo Externo o interno Externo o interno Externo o interno
Exploración SUS IEEE 1149.1 (JTAG) IEEE 1149.1 (JTAG) IEEE 1149.1 (JTAG)

NVIDIA ha sido durante largo tiempo consciente de los problemas de apretar hasta el límite o por encima de él las frecuencias de las memorias GDDR en sus gráficas. Hasta ahora, siempre ha respondido que el límite lo marcaba el fabricante y que no había que excederse con dicho overclock, pero con Ampere ha querido terminar con los problemas de una vez por todas.

La manera de hacerlo ha sido con EDR o Error Detection and Replay, el cual es un algoritmo introducido en el subsistema de memoria de la GPU, el cual puede detectar cuando ocurre un error en la transmisión de datos. Cuando esto ocurre, algo muy típico cuando apretamos los clocks a la memoria GDDR6X, envía esta operación de verificación al CRC (Cyclic Redundancy Check) mediante cualquiera de sus dos canales, el cual, al comprobarlo y darle validez en dicho error, dicha transmisión errónea se vuelve a intentar o directamente se reproduce.

GDDR6X errores

¿Qué se consigue con esto? ¿no sería mejor marcar el error y dejarlo default o inutilizado y seguir con el resto de operaciones? No, no es ni mucho menos lo más útil como ya demostró GDDR5. Lo que hacen estos dos algoritmos es volver a intentar la transmisión que dio error hasta que se produce de forma exitosa.

NVIDIA recomienda no excederse con el overclock

Micron GDDR6X

¿Por qué seguir intentando una transmisión que da error? Para evitar el colapso de la VRAM o el bloqueo de la GPU o el sistema. A mayor velocidad apretemos las memorias GDDR6X se producirán más errores y con ello habrá más transacciones reintentadas, lo que consumirá ancho de banda de dichas memorias GDDR6X. Esto merma el rendimiento final de la GPU, por lo que dejaremos de ganar puntuación o FPS, indicando que hemos llegado al límite del overclocking sin que un solo módulo muera.

Como todo en esta vida, nada es seguro. Aunque tenemos EDR y CRC, NVIDIA afirma que es posible que ni siquiera veamos artifacts en pantalla, pero eso no quiere decir que en todos y cada uno de los casos los módulos no queden dañados por el overclocking, al contrario, puede pasar.

Lo que intenta decirnos NVIDIA es que cuando el rendimiento ya no suba más, el límite está superado y hay que bajar uno o más tramos de overclocking y por lo tanto hay que dejar de subir la frecuencia, porque de hacerlo, llegará un momento donde ninguno de los algoritmos pueda evitar un bloqueo del sistema.

Aun así, también indican que, aunque no lleguemos a este extremo que hay que evitar, es posible que EDR no evite todos los bloqueos antes de que el rendimiento se estabilice al 100%, por lo que no es una tecnología infalible, como siempre suele pasar.