Detallada la arquitectura de los chips NVIDIA Volta GV100

Escrito por Rodrigo Alonso

Durante el evento GTC 2017, NVIDIA ha anunciado por fin su nueva arquitectura Volta que llegará en las próximas generaciones de tarjetas gráficas con el chip GV100 a la cabeza. Los de verde han publicado sus características técnicas principales con todo lujo de detalles, así que por fin estamos en disposición de hablar de la futura generación de gráficas GeForce GTX 20 Series.

De acuerdo a los diagramas publicados por el fabricante, el chip GV100 tiene una estructura interna similar a la actual generación Pascal pero lógicamente con variaciones importantes, especialmente en los Streaming Multiprocessors (SMs). En el chip Volta mostrado, los SMs cuentan tanto con cores FP32 como con FP64, si bien las implementaciones para el consumidor de éste chip carecerán de los cores FP64 especializados para tareas de cómputo gráfico utilizado en entornos profesionales (por lo que éstas variantes se reservarán para las gráficas profesionales de la marca). Cada uno de los SMs cuenta con 64 núcleos CUDA FP32 y 32 FP64. Los cores FP64 pueden manejar operaciones de 32, 16 e incluso 8 bits.

Los chips GV100 de arquitectura Volta al detalle

Cada uno de éstos chips cuenta con 80 SMs, por lo que estamos hablando de un total de 5.120 cores FP32 y 2.560 cores FP64. Adicionalmente, Volta introduce un nuevo componente llamado Tensor Cores, una maquinaria especializada diseñada para acelerar procesos orientados a deep learning y redes neuronales de datos. Cada SM tiene ocho de éstos cores, así que el chip tiene en total 640. Igual que con los cores FP64, los Tensor Cores no estarán implementados en las versiones comerciales del chip.

Con estos datos, el chip contará con un total de 320 TMUs, y en principio la versión de referencia tendrá los núcleos funcionando a 1455 Mhz en modo Boost. Con todos estos datos tendremos un total de 15 TFLOPs de potencia bruta FP32 y 7,5 TFLOPs de potencia bruta FP64. Por supuesto, estarán fabricados con el nuevo nodo a 12 nanómetros y la GPU estará rodeada de cuatro chips de 32 Gbit HBM2 de memoria, sumando un total de 16 GB.

Dado que la interfaz de ésta memoria es de 4.096 bits, estaríamos hablando de que a 1 Ghz de velocidad tendríamos 1 TB/s de ancho de banda de memoria, aunque se espera que haya modelos que incorporen memoria GDDR6 en su lugar.

Continúa leyendo