El lanzamiento de la arquitectura Maxwell pasó casi desapercibido con el lanzamiento de las GeForce GTX 750 Ti, ya que en términos de rendimiento no aportaba gran cosa con respecto a Kepler. Sin embargo, y como hemos visto sobre todo con otros modelos superiores lanzados por NVIDIA como las GTX 760 o las recientes GTX 980 y GTX 970, sí que ha dejado bastante atrás a Kepler en cuanto al consumo. Ahora NVIDIA ha decidido darle una segunda vida a esta arquitectura Kepler con el lanzamiento del chip GK210, lanzado junto a las gráficas profesionales Tesla K80 de doble GPU.
Las NVIDIA Tesla K80 son un acelerador gráfico de doble GPU, concretamente con dos GK210 de arquitectura Kepler. Cada uno de estos chips incorpora 2.496 CUDA Cores (4.992 en total), y tienen un ancho de banda de memoria GDDR5 de 384 bits, unidos a 12 GB de memoria, sumando un total de 24 GB nada más y nada menos. Esta abrumante cantidad de RAM gráfica tiene un ancho de banda de 240 GB/s en dos interfaces, aunque es cierto que NVIDIA ha sido bastante conservadora a la hora de elevar la velocidad de funcionamiento tanto del chip como de la memoria: 512 Mhz en el chip (que pueden subir hasta los 875 Mhz) y 5 Ghz en la memoria (las Tesla K40 tienen la memoria funcionando a 6 Ghz).
Explicado esto, ¿cuál es la diferencia del GK210 y el anterior GK110? Para empezar, la eficiencia energética. Las Tesla K80 no necesitan refrigeración activa (fijaos en la imagen de arriba que se trata de un disipador pasivo, sin ventiladores) y tienen un TDP de 300W (150W por chip). En comparación, las anteriores Tesla K40 tenían un TDP de 235W con un solo chip.
Pero la mayor diferencia entre estos dos chips es técnica y está escondida bajo el IHS. Aunque ambos chips son de arquitectura Kepler, el GK210 tiene el doble de memoria caché. Cada uno de sus 15 SMXs (streaming multi processors) tiene 128 KB de memoria caché, justo el doble que los del chip GK110. Además, incorpora 512 KB de archivo de registro por SMX, también el doble que el GK110, lo que significa que estas gráficas son capaces de utilizar un mayor número de variables para calcular en los Shader Processors.