A la hora de navegar por Internet, es raro no encontrarnos con algún captcha para acceder o realizar cualquier acción. Este sistema diseñado para evitar que los bots campen a sus anchas en Internet, es un sistema que lleva muchos años en funcionamiento e invita al usuario a reconocer objetos en una imagen o un texto, aunque también existen otras variantes.
Señales de tráfico, escaleras, autobuses y coches son algunos de los objetos que debemos encontrar en varias imágenes para poder acceder al contenido que hay detrás. De esta forma, la web se asegura que el tráfico que accede a su plataforma no son bots, sino personas reales de carne y hueso.
Saltarse estos acertijos siempre ha sido muy fácil utilizando extensiones para navegadores obligando a las empresas a actualizarse continuamente a versiones más actualizadas que las extensiones y otros métodos no son capaces de resolver. Pero, claro, no contaban con la Inteligencia Artificial.
Los CAPTCHA no son infalibles
La falta de interés por parte de Google a la hora de actualizar reCAPTCHAv2 y centrarse únicamente en reCAPTCHAv3, ha permitido a un grupo de investigadores entrenar una IA con 14.000 imágenes de tráfico para que sea capaz de derrotar a los CAPTCHAS con una tasa de efectividad del 100%.
reCAPTCHAv3, al ser la última versión disponible utiliza otros sistemas para determinar si se trata de un humano o de un bot de forma diferentes al tradicional sistema de reconocimiento de imágenes. De momento, reCAPTHAv2 es completamente vulnerable a esta Inteligencia Artificial y con reCAPTCHAv3 existe una elevada tasa de acierto, pero no del 100%.
Afortunadamente para los usuarios, la mayoría de los sitios web utiliza reCAPTCHAv2. Esta IA utiliza un modelo de reconocimiento de objetos You Only Look Once, también conocido como YOLO. El método CAPTCHA siempre ha planteado dudas acerca de su verdadera utilizada a la hora de proteger el acceso a sitios web a los bots y la llegada de la Inteligencia Artificial no ha hecho más que confirmarlo.
Según podemos leer en este estudio:
Al realizar experimentos sistemáticos, hemos demostrado que los sistemas automatizados que utilizan tecnologías avanzadas de IA, como los modelos YOLO, pueden resolver con éxito captchas basados en imágenes.
Este hallazgo plantea dudas sobre la fiabilidad de los captchas basados en imágenes como método definitivo para distinguir entre humanos y bots. Nuestros hallazgos indican que los mecanismos actuales de captcha no son inmunes al rápido avance del campo de la inteligencia artificial.
Es importante señalar que este estudio no se ha llevado a cabo para comprobar cómo es de seguro reCAPTCHAv2 de Google, sino para encontrar métodos para el scraping. La técnica del scraping consiste en acceder a un sitio web extrayendo información para entrenar una IA principalmente, aunque no de forma exclusiva.
Lo que está claro, por si alguien tenía todavía alguna duda, es que los CAPTCHAS van a seguir en Internet en un futuro para evitar el uso de bots para cualquier tarea, no solo como se utiliza en estos momentos para obtener información, sino también para evitar que las webs sufran ataques DDOS entre otros.