Así es cómo tu CPU y GPU realizan los cálculos matemáticos en tu PC

Redacción Publicado el 16 de junio, 2021 • 20:00

La ALU o conocida en español como unidad logicoaritmética son las unidades dentro de una CPU o una GPU que literalmente se encargan de crujir números y por tanto son responsables de todos los cálculos matemáticos que se realizan varios miles de millones de veces por segundo en nuestros PCs. Pero, ¿cómo funcionan, qué tipos hay y cuáles son los secretos de las unidades ALU? Seguid leyendo para saberlo.

La primera ALU que se lanzó al mercado no formaba parte de una CPU, sino que fue un chip de la serie 7400 con interfaz TTL de Texas Instruments, el 74181 fue la primera ALU integrada en un solo chip. Era solo de 4 bits y fue utilizada en varios miniordenadores durante los años 60, significando la primera gran transición de la informática.

La construcción de las primeras CPU completas durante los años 70 y con todos los elementos correspondientes para ejecutar un ciclo de instrucción completo tuvieron que contar obviamente con la integración de las ALU para calcular las instrucciones lógicas y las aritméticas dentro del chip.

Tipos de ALU

SIMD Escalar

Podemos dividir las ALUs en dos subdivisiones distintas, la primera de ellas es por el tipo de número que ha de calcular y por tanto si se opera con enteros o con coma flotante, donde en el último caso estamos hablando de operar con decimales. Las operaciones en coma flotante siguen una normativa que indica cuantos bits del número corresponden a la parte entera y cuántos a la parte fraccionada.

Los estándares en ambos casos también indican si el primer número marca el signo o no, por ejemplo un número en enteros de 8 bits puede representar una cifra de 0 a 255 o de -127 a 127 según el formato utilizado.

La segunda categorización hace referencia a cuantos datos e instrucciones ejecuta una ALU al mismo tiempo. Siendo la forma más simple la ALU escalar donde se realiza una operación o instrucción por operando. También tenemos las unidades SIMD o vectoriales, las cuales realizan una misma instrucción con diferentes operandos al mismo tiempo.

Tipos de operaciones con una ALU

ALU suma binaria

En primer lugar hemos de tener una ALU no puede funcionar por sí sola, por lo que va a ser necesaria una unidad de control que le marque que instrucción ha de realizar y sobre que dato lo ha de hacer. Por lo que en esta explicación vamos a suponer que tenemos una unidad de control acompañando a nuestra ALU.

Una ALU lo que le permite a una cualquier tipo de procesador, ya sea una CPU o una GPU, realizar operaciones matemáticas con números binarios. Por lo que no es más que una calculadora binaria, siendo el tipo de ALU más simple el que permite sumar dos números de 1 bit cada uno, lo cual se trata de una operación que quedaría de la siguiente manera:

Operación	Resultado	Acarreo
0+0	0	0
0+1	1	0
1+0	1	0
1+1	1	1

Si os fijáis esto son las especificaciones de una puerta lógica del tipo OR, pero nos encontramos con un problema que es al acarreo al sumar 1+1, ya que el resultado de sumar binariamente 1+1 es 10 y no 1. Por lo que tenemos que tener en cuenta ese 1 en el acarreo que nos llevamos y por tanto no nos es suficiente con una simple puerta OR, especialmente si queremos trabajar con una precisión en bits mucho más alta y por tanto tener una ALU mucho más compleja en número de bits.

Resta binaria en una ALU

ALU resta binaria

La resta o sustracción se puede derivar con la siguiente fórmula:

A – B = A + NOT(B)+1

El truco aquí es muy sencillo, se basa en que en el caso de que estemos trabajando con enteros binarios. Esto no funciona con números en coma flotante. Podemos utilizar el mismo mecanismo que se utiliza para sumar dos números para realizar la operación de resta. Lo único que necesitamos es invertir el valor del segundo operando a través de una serie de puertas NOT y sumar 1 al resultado final. Gracias a ellos podemos utilizar el mismo hardware para realizar una operación de suma para realizar una resta.

Multiplicación y división binarias en potencias de 2

ALU multiplicación división desplazamiento

La forma de multiplicación más simple en un sistema binario es la multiplicación por números múltiplos de 2, al ser un sistema binario, sólo tenemos que implementar un mecanismo donde los datos de entrada se desplacen varias posiciones a la izquierda, si estamos multiplicando, o a la derecha, si estamos dividiendo. ¿La cantidad de posiciones? Depende del índice de potencia de 2 del multiplicador, así pues, si estamos multiplicando por 8 que es 2^3 entonces deberemos desplazar el número 3 posiciones hacia la izquierda y si es dividiendo 3 posiciones a la derecha. Es por este motivo que las ALU integran también operaciones de desplazamiento de bits, las cuales son la base para multiplicar o dividir por múltiplos de 2.

Pero si hablamos de multiplicar otro tipo de números lo mejor es volver a cuando éramos pequeños en la escuela.

Multiplicación con números que no son potencia de 2

Multiplicación binaria ALU

Durante muchos años las ALU eran muy simples y solo podían sumar, ya que no tenían ALUs pensadas para la multiplicación. ¿Cómo realizaban entonces? Pues ejecutando varias sumas concatenadas lo que les llevó muchos ciclos. Como curiosidad histórica, una de las primeras CPU domésticas en tener unidad de multiplicación fue el Intel 8086.

Supongamos que queremos multiplicar 25 x 25, cuando éramos pequeños lo que hacíamos era lo siguiente:

Primero multiplicamos 25 x 5 y apuntamos el resultado, el cual es 125.
Segundo multiplicamos 25 x 2, lo que nos da 50 y apuntamos el resultado pero desplazado una posición hacía la izquierda.
Sumamos ambos números, dado que tenemos el segundo número desplazado a la izquierda el resultado de la suma no es 175, sino 625 que es el resultado de multiplicar 25 x 25 en decimal.

Pues bien, en binario el proceso es el mismo, pero el número 25 en este caso es 11001 y por tanto un número de 5 bits. Por lo que binariamente vamos a multiplicar 11001 x 11001 y para ello vamos a tener que utilizar las puertas AND.

En primer lugar, multiplicamos 11001 x 1 = 11001
En segundo lugar, multiplicamos 11001 x 0= 0000, escribimos el resultado una posición hacia la izquierda.
En tercer lugar multiplicamos 11001 x 0= 0000, escribimos el resultado dos posiciones hacia la izquierda.
En cuarto lugar, multiplicamos 11001 x 1 = 11001, escribimos el resultado tres posiciones hacia la izquierda
En quinta lugar, multiplicamos 11001 x 1 = 11001, escribimos el resultado cuatro posiciones hacia la izquierda
Teniendo en cuenta la posición de cada operación sumamos el resultado, el cual no debería dar como resultado 01001110001

Operaciones matemáticas más complejas

Con lo anterior explicado podéis construir unidades para realizar operaciones matemáticas mucho más complejas como por ejemplo divisiones, raíces cuadradas, potencia, etcétera. Cuanto más compleja sea la operación obviamente se van a necesitar más transistores. En realidad para cada operación existe un mecanismo distinto y cuando la unidad de control le dice a una ALU el tipo de operación que ha de ejecutar entonces lo que está haciendo es decirle que tiene que utilizar esa mecanismo en concreto para ese operación matemática en concreto.

Como lo importante es ahorrar en transistores, las operaciones más complejas se definen como una sucesión de las más simples con tal de reaprovechar el hardware. Esto lleva a que esas operaciones más complejas requieren una cantidad de ciclos de reloj más altos. Aunque en algunos diseños se implementan mecanismos completos que permiten realizar dichas operaciones en una cantidad de ciclos mucho menores e incluso en un solo ciclo en muchos casos, pero no son habituales en las CPU.

En donde sí que son utilizadas en las GPU, donde vemos un tipo de unidad llamada Special Function Unit que se encarga de ejecutar lo que llamamos operaciones trascendentales como por ejemplo las razones trigonométricas que se utilizan en la geometría.

¿De donde saca la ALU los datos para operar?

Registros

En primer lugar hemos de tener en cuenta que una ALU no opera con los datos en memoria, sino que en el proceso de captación y descodificación los datos con los que ha de trabajar se guardan en un registro llamado acumulador, sobre el que se realizan las operaciones.

En algunos sistemas más complejos se utiliza más de un registro para las operaciones aritméticas y en algunos casos incluso registros especiales para algunas instrucciones. Los cuales se encuentran documentados la mayoría de veces, pero en otros casos debido a que son utilizados en solo ciertas instrucciones no se suelen documentar.

El motivo por el cual utilizar los registros es por su cercanía respecto a la ALU, si se utilizará la memoria RAM entonces se tardaría mucho más tiempo en realizar una simple operación. El otro motivo es porque se consumiría mucha más energía para realizar una operación.

Con todo esto queda explicado cómo funciona una ALU, al menos en lo que a términos básicos se refiere.