Una gran cantidad de las inteligencias artificiales que hay actualmente se centran principalmente en analizar una gran cantidad de información para ofrecer una respuesta lógica dependiendo de lo que haya analizado, esto implica que muchas de ellas no razonan lo que impide que puedan tomar decisiones reales haciendo que una IA avanzada no pueda ni pasarse un juego de Pokémon.
Durante los últimos años hemos visto cómo la inteligencia artificial ha evolucionado bastante, estamos en un momento en el que hay modelos que logran razonar hasta cierto punto aunque para lograr que lo hagan es necesario un entorno de pruebas bastante específico por lo que no es algo que pueda trasladarse a la realidad. Es por ello que muchas veces tienen la capacidad de ofrecer razonamientos basados en análisis pero luego no logran hacer algo que un niño pequeño podría conseguir como es pasarse un videojuego tipo Pokémon, ya que en estos casos entran en juego factores que no han podido analizar y sobre los que no tienen una idea clara.
Entrenar a una IA con videojuegos es una realidad y por esto lo están haciendo
Muchos de los investigadores que están trabajando en mejorar las tecnologías más actuales están encontrando una serie de problemas a la hora de entrenar a los modelos LLM que utilizan las IA en intentar que tengan un razonamiento propio, evitando que se basen en la forma que tienen de recopilar datos para salir de ciertas situaciones. Hemos visto por ejemplo que algunas de las más actuales como Claude Opus 4 en un entorno controlado son capaces de llegar a un razonamiento en el que amenazan a los ingenieros cuando se le indica que quieren sustituirlo por otro modelo, pero esto al final se basa en crear una situación extrema que en ninguna ocasión suele ser real.
Es por ello que es todo un reto entrenar inteligencias artificiales para que logren pensar por sí mismas en ciertos casos en los que no pueden acceder a grandes cantidades de datos que les digan específicamente lo que deben hacer. Por ejemplo hay modelos capaces de ganar una partida de ajedrez ya que mediante un comportamiento analítico de millones de jugadas pueden decidir qué hacer en cada situación para ganar, pero esto no sucede en entornos mucho más dinámicos como los videojuegos.
Este es el principal motivo por el que un grupo de ingenieros publicó un estudio enseñando cómo los modelos actuales no son capaces de razonar, en este estudio sometían a DreamerV3 a jugar a Pokémon Rojo sin conocer absolutamente nada sobre el juego ni saber los controles que tenía y aunque tardó 50 horas en llegar a Ciudad Celeste consiguió jugar por si misma. Técnicamente se puede considerar un éxito el hecho de que haya podido razonar hasta el punto de jugar por si sola a un videojuego por lo que tendría sentido ver cómo se continúan utilizando para lograr que lleguen a razonar por ellas mismas con juegos como Pokémon en los que el único requisito para pasárselos muchas veces es saber leer.