Conforme la Inteligencia Artificial ha ido mejorando su funcionamiento, esta ha comenzado a tener sus propias ramificaciones para poder sacarle un mayor partido y que cada nueva versión de Gemini o GPT, no sea más de lo mismo.
Una de las más importantes y que, además, ha levantado muchas preocupaciones por lo que implica es la IA agentiva. Si hablamos de una IA como ChatGPT o Gemini básicamente hablamos de un chat conversacional donde podemos pedirle que cree, resuma o traduzca un texto, que cree imágenes o vídeos o incluso música en base a unas determinadas instrucciones.
La IA agentiva funciona de una forma totalmente diferente. Cuando hablamos de IA agentiva, hablamos de una Inteligencia Artificial diseñada para funcionar de forma autónoma, un paso hacia sistema de IA que es capaz de razonar y actuar sin supervisión directa.
Qué es una IA agentiva
Un agente de IA es un software diseñado para percibir su entorno (en base a sensores o introduciendo datos de forma manual) que es capaz de tomar decisiones propias basándose en estas y ejecutar acciones hasta lograr su objetivo, todo ello de forma autónoma, sin que un humano tenga que interactuar con ella en ningún momento.
La principal diferencia entre una IA tradicional tal y como la conocemos es que una IA agentiva es capaz de funcionar de forma autónoma y tiene un alto grado de persistencia para lograr su objetivo ajustando el plan para llevarlo a cabo sobre la marcha y lo repite las veces que haga falta.
Otra diferencia entre la IA agentiva y la IA tradicional es que la primera tiene memoria, lo que permite basar sus decisiones en acciones que ha realizado en el pasado.
Componentes de una IA agentiva
Grosso modo, una IA agentiva está formada por los siguientes componentes:
- Percepción. Es la capacidad de recibir datos e interpretarlos dentro de un contexto, ya sea a través de sensores o con la introducción manual de datos.
- Memoria. Es la forma de almacenar y tener acceso a la información almacenada contrastándola con la información actual y del entorno para mantener el texto y aprender en base a los cambios observados.
- Planificación. Como bien describe su nombre, se trata de una secuencia de pasos para conseguir el objetivo deseado desde un punto inicial.
- Ejecución y acción. Es la capacidad de interactuar con el mundo exterior basándose en un plan: escribir un email, apuntar una cita en el calendario, ejecutar un script, interactuar con APIs en base a las decisiones que toma.
- Metacognición. Es la capacidad de evaluar los resultados de sus acciones. Esto le permite aprender de los errores cometidos durante la ejecución para no volver a repetirlos en un futuro.
Un agente de IA necesita de un modelo de lenguaje que le ayude a entender las instrucciones, razonar y generar respuestas que, normalmente es un LLM ya sea GPT o Gemini. Uno de los agentes de IA más populares es OpenClaw, un agente que, a pesar de haber sido comprado por OpenAI, sigue siendo de código libre y gratuito. Además, podemos utilizarlo de forma local desde cualquier PC con una gráfica NVIDIA RTX.
