¿Qué significan Entrenamiento e Inferencia en la Inteligencia Artificial?

¿Qué significan Entrenamiento e Inferencia en la Inteligencia Artificial?

Josep Roca

En los últimos años estamos viendo todo tipo de usos para la inteligencia artificial, desde sistemas multimedia que mejoran la resolución de las imágenes o cancelan el ruido de ambiente en las videoconferencias, pasando por sistema de reconocimiento facial e incluso motores de recomendación cuando estamos comprando online o buscando qué película ver por la noche desde tu Smart TV. Pero, ¿cuál es el proceso con el cual la IA aprende para crear un modelo para resolver esos problemas? A esto se le llama Entrenamiento e Inferencia y os lo vamos a explicar.

¿Qué podemos definir como Inteligencia Artificial? Para algunas personas es que los ordenadores piensen o tengan consciencia propia, pero en el caso que nos ocupa tiene que ver con el tratamiento de los conjuntos de datos, es decir, con la información que se le otorga al sistema. A día de hoy está en todos lados y se puede decir que son sistemas automatizados que generan respuestas según los datos de entrada que reciben a partir de un modelo construido a partir de un periodo de entrenamiento o aprendizaje.

Pero para poder dar dichas respuestas los sistemas de IA han de ser obviamente entrenados, dicho de otra forma: se les ha de educar y por tanto enseñar. Os vamos a dar una pequeña introducción sobre cómo «aprenden» los sistemas de inteligencia artificial, qué es lo que hay detrás de esta tecnología, la cual parece lo suficientemente avanzada para que nos parezca magia en muchos momentos.

La explicación que os vamos a dar acerca de lo que son el entrenamiento y la inferencia es completamente genérica y global, por lo que no tiene relación concreta con ningún hardware en particular.

Entrenamiento: Educando a la IA

Cortocircuiito Input

Se conoce como entrenamiento a la construcción de un modelo de inferencia para resolver un problema concreto, principalmente se utiliza la inteligencia artificial para resolver tres tipos de tareas distintas: tareas de clasificación de la información, tareas de búsqueda de patrones y tareas de conducción automática, para las cuales se utilizan tres formas de aprendizaje distintas:

  • Aprendizaje con supervisión: se le da a la inteligencia artificial un conjunto de datos de entrada y la tarea es que la IA pueda etiquetar el dato de entrada de manera correcta. Inicialmente se le da a la IA el conjunto de datos con las etiquetas correctas, y estos son los datos de entrenamiento. Luego se supervisa el modelo de inferencia generado con un set de datos de prueba, el cual puede ser respondido con verdadero o falso por la IA.
  • Aprendizaje sin supervisión: se utiliza cuando queremos que la IA no haga una clasificación de los datos y por tanto no se utilizan etiquetas asociadas al set de datos de aprendizaje. Lo que se busca con este método de aprendizaje es detectar patrones, y lo que hace la IA en este caso es buscar y agrupar los datos según su similitud. Es el tipo de aprendizaje más utilizado en el tratamiento de datos multimedia.
  • Aprendizaje reforzado: en el caso concreto de este tipo de aprendizaje lo que hacemos no es decirle a la IA por ejemplo qué es un gato o que aprenda a distinguir un gato, sino que lo que estamos haciendo en enseñarle unas reglas de juego. El símil más parecido en la vida real es cuando estamos aprendiendo a conducir un coche y tenemos el profesor de la autoescuela es buena, y es precisamente la IA que se utiliza para entrenar a los coches con conducción automática. En este modelo el set de datos de entrenamiento es provisto a tiempo real y las conclusiones que saca la IA son evaluadas por un agente supervisor que la alimenta. Dicho agente puede ser un ser humano, una base de datos compleja e incluso otra IA.

Otro tipo de inteligencias artificiales son las generativas, que se basan en generar datos de manera aleatoria; dichos datos en realidad no son más que ruido y requieren de un elemento externo que las descarte y/o las clasifique. En ese caso la IA generativa desconoce de entrada lo que se busca y solo lo acaba aprendiendo a partir de una segunda IA, la cual puede realizar la evaluación por clasificación o por búsqueda de patrones.

NVIDIA Saturn-V

Dependiendo del tipo de problema para el cual se quiera crear un modelo-solución, el proceso de entrenamiento puede requerir mayor o menor nivel de potencia y tiempo. Por ejemplo hay casos donde es necesario utilizar centros de datos compuestos por decenas e incluso cientos de ordenadores mientras que otros problemas pueden ser solventados por un PC doméstico de baja potencia.

Inferencia: La IA pone en práctica lo aprendido en el entrenamiento

Neuronas

Una vez que la IA ha aprendido el modelo, se crea un modelo de inferencia que será el que utilizará para resolver y/o clasificar el problema. Para ello utilizamos un tipo de hardware en el que cada unidad está conectada con otras en una red y se van pasando los datos por turnos; a este hardware lo llamamos redes neuronales o neurales y son unidades cuyo funcionamiento está inspirado en la forma en la que el cerebro procesa la información visual a través de los ojos. Esta estructura es lo que permite a los procesadores de inteligencia artificial aprender estructuras complejas sin requerir cantidades ingentes de datos.

Las redes neuronales

Red Neuronal

Una red neuronal, independientemente de si es artificial o natural, consiste en una gran cantidad de unidades simples (las neuronas) y se transmiten información entre ellas. En el mundo de la informática una neurona puede ser una simple ALU o un procesador completo. En el ámbito del hardware todas las unidades están interconectadas entre sí, pero cuando se genera un modelo de inferencia lo que hace es desactivar las conexiones que no se utilizan.

En este tipo de redes, el cable o camino de datos utilizado para proporcionar los datos de entrada son llamados dendritas y los cables que comunican las neuronas entre si se llaman axones. Para mayor información os recomendamos leer en este mismo sitio web titulado «Procesadores dedicados para IA, ¿cuáles son y cómo funcionan?«.