Potencia y bajo consumo: GPU de servidor NVIDIA RTX A4500 y A2000

Redacción Publicado el 24 de noviembre, 2021 • 10:09

A partir del lanzamiento de su arquitectura Turing al mercado, conocidas como GeForce RTX 20 en el mercado gaming, la marca Quadro se reemplazó por una nueva, la de RTX Axxx. Pues bien, sin previo aviso NVIDIA ha lanzado nuevas GPU profesionales, A4500 y A2000, esta vez basadas en su arquitectura Ampere, la misma que las RTX 30. ¿Qué especificaciones y en que se diferencian de las GeForce para gaming?

Las tarjetas gráficas se utilizan en varios mercados y aunque el más conocido es el del gaming para PC, estas se utilizan en otros mercados debido a que se trata de unidades de proceso que no solamente se utilizan para generar gráficos. Como es el caso de la computación científica y últimamente la inteligencia artificial. Aunque no es el caso de las de las RTX A4500 y RTX A2000, ya que están pensadas para el mercado de las gráficas profesionales.

Especificaciones de la RTX A4500

	NVIDIA RTX A4500
Arquitectura	Ampere
Proceso litográfico	Samsung 8 nm
GPU	GA102
Tamaño del die	628 mm2
Transistores	23.800 millones
SM / CU	56
Núcleos CUDA (FP32)	7.168
TMU	224
ROPs	112
RT Cores	56
Tensor Cores	224
Caché L2	6 MB
Reloj Base	1.656 MHz
Tipo de VRAM	GDDR6
Reloj VRAM	16 Gbps
Bus	320 bits
Ancho de banda VRAM	640 GB/s
Rendimiento FP32	23,7 TFLOPS
Versión PCIe	4.0 x16
TDP	200 W
Alimentación	8 pines
NVLink / SLI / Crossfire	Si
Salidas de vídeo	4 x DisplayPort 1.4

La RTX A4500 usa la misma GPU que las RTX 3080 (Ti) y RTX 3090, es decir, el GA102, pero debido a que está diseñada para funcionar en centros de datos para dar servicios de computación en la nube sus especificaciones son distintas, ya que al igual que ocurre con las CPU para servidores que necesitan funcionar las 24 horas del día y los 7 días a la semana, es por ello que sus especificaciones son algo más bajas que las tarjetas gráficas para gaming.

Esta tarjeta gráfica profesional consume 200 W, una cifra muy baja para una basada en la GPU GA102, aunque realmente no es exactamente el mismo chip que en el hardware que se vende para gaming, ya que tiene algunas diferencias que son clave para el mercado de las estaciones de trabajo y los centros de datos y que os contamos unas secciones más abajo.

¿Sus especificaciones exactas? Tenemos 7168 ALU en FP32 conocidas en el hardware de NVIDIA como núcleos CUDA, dado que se basa la arquitectura Ampere esto son 56 SM que en su interior incluyen el mismo número de RT Cores y 224 Tensor Cores. ¿Su velocidad de reloj y potencia? 1.656 MHz de velocidad que dan una tasa de 23,7 TFLOPS en coma flotante de simple precisión, 32 bits, y 189,2 TFLOPS en coma flotante de 16 bits a través de los Tensor Cores. En cuanto a la VRAM tenemos 20 GB en modo x8 configuradas en un bus de 320 bits GDDR6 a 16 Gbps para un ancho de banda de 640 GB/s.

Cada una de las RTX A4500 se conecta a la estación de trabajo al centro de datos a través de una interfaz PCI Express 4.0, pero podemos interconectar dos a través de la interfaz NVLink y un puente para que funcionen de manera conjunta.

Especificaciones de la RTX A2000

	NVIDIA RTX A2000
Arquitectura	Ampere
Proceso litográfico	Samsung 8 nm
GPU	GA106
Tamaño del die	276 mm2
Transistores	13.250 millones
SM / CU	26
Núcleos CUDA (FP32)	3.328
TMU	104
ROPs	48
RT Cores	26
Tensor Cores	104
Caché L2	3 MB
Reloj Base	1.200 MHz
Tipo de VRAM	GDDR6
Reloj VRAM	12 Gbps
Bus	192 bits
Ancho de banda VRAM	288 GB/s
Rendimiento FP32	8 TFLOPS
Versión PCIe	4.0 x16
TDP	70 W
Alimentación	No
NVLink / SLI / Crossfire	No
Salidas de vídeo	4 x DisplayPort 1.4

La segunda de las GPU profesionales que acaba de lanzar NVIDIA es la RTX A2000, la cual es más modesta que su la RTX A4500, ya que se basa en la GPU GA106, la misma que la de las tarjetas gráficas RTX 3060 para gaming, sin embargo, ha sido configurada para funcionar en un centro de datos o en una estación de trabajo como el resto de la familia RTX A.

Nos encontramos con una tarjeta gráfica con un consumo muy bajo, de solo 70 W, por lo que funciona con la energía que entrega el propio puerto y no requiere de un conector externo. Esta se ofrece en dos versiones distintas, una con 6 GB de VRAM GDDR6 y otra con 12 GB; en ambas versiones la VRAM funciona a 12 Gbps, lo que da un ancho de banda de 288 GB/s. En cuanto a los cambios hechos a la variante profesional de la GA106 son los mismos que los de la GA102 de la RTX A4500.

Aunque lo que realmente nos interesan son sus especificaciones y en ese caso tenemos 3328 núcleos CUDA configurados en 26 SM que contienen en conjunto 26 RT Cores y 104 Tensor Cores que le dan una potencia de 8 TFLOPS en FP32 y 63,9 TFLOPS en FP16 a través de los Tensor Cores. Al contrario que la RTX A4500, este modelo carece de interfaz NVLink y, por tanto, no podemos hacer tándem de dos tarjetas gráficas.

Diferencias con las RTX 30

VRAM

Pese a que NVIDIA anuncia estas tarjetas gráficas con las mismas GPU que podemos encontrar en las NVIDIA GeForce RTX 30 realmente no es así, ya que a nivel de hardware hay cambios importantes que requieren una circuitería completamente nueva y no se puede conseguir solamente a través de los drivers.

El primer cambio se encuentra en el procesador de comandos que se encuentra en la parte central de la GPU, en estos casos se han diseñado para manejar de manera virtualizada varias listas de pantalla que son independientes entre ellas. Esto es clave para la computación remota o en la nube, ya que permite dividir su potencia entre varios clientes. Las RTX 30 para gaming solo pueden manejar dos listas de pantalla, pero no más.
El segundo elemento está en la memoria local de la tarjeta, es decir, la VRAM. En el caso de la RTX A4500 no se utiliza la GDDR6X, sino la GDDR6 con tal de ahorrar consumo, no obstante, la GDDR6X no soporta corrección de errores o ECC mientras que la GDDR6 si, algo clave en el entorno servidor. Tal característica también se encuentra en la RTX A200.
En tercer lugar, tenemos su salida de vídeo y es que aunque ambas soportan HDCP 2.2, no obstante son cuatro conectores DisplayPort 1.4 con audio y no hacen uso de ninguna salida HDMI.
Tampoco nos podemos olvidar del hecho de que tienen un NVENC más avanzado que permite codificar varios streams de vídeo al mismo tiempo y, por tanto, no está limitado como la versión del códec de vídeo por hardware para las GeForce.
El último cambio tiene que ver con el hecho de que han de funcionar en un centro de datos a todas horas sin problemas, es por ello que carecen de mecanismos de subida puntual de la velocidad de reloj, lo que conocemos como velocidad de Boost.

Aunque la mayor diferencia se encuentra en el precio, el cual en esta gama de tarjetas gráficas es mucho más alto que una GeForce convencional, tanto que incluso no es rentable siquiera para la minería de criptomonedas, incluso teniendo en cuenta su potencia por vatio por su bajo consumo, aunque por el momento lo desconocemos.