Bender de Futurama, cobra vida en forma de asistente con ChatGPT y una Raspberry Pi
Si hablamos de asistentes personales, lo primero que nos viene a la cabeza el que podemos encontrar en nuestro PC o móvil, ya sea Siri, Bixby, Cortana, Alexa o el asistente de Google (que no tiene nombre propio). Estos asistentes se encargan de buscar información en Internet para responder a nuestras preguntas además de ser capaces de realizar determinadas acciones relacionadas con el dispositivo donde se ejecuta.
Sin embargo, como siempre decimos, la imaginación no tiene límites y sino, que se lo digan a Manuel Ahumada quien ha creado su propio asistente virtual basado en Bender, el mítico robot doblador de vigas y fumador de puros de la serie Futurama.
Cuando decimos basado en el personaje de la serie Futurama, nos referimos a que ha utilizado tanto la voz (de la versión americana doblado por John DiMaggio) como el diseño de la cabeza. Para llevar a cabo este proyecto, mucho más completo que cualquier otro asistente personal, ha utilizado, como no, una Raspberry Pi y ChatGPT además de otras plataformas de IA y, por supuesto, una impresora 3D para crear la carcasa.
Un asistente personal único
Ahumada ha construido no solo un asistente personal único y muy original, sino que, además, es mucho más inteligente que el resto de los asistentes personales que podemos encontrar en el mercado (Siri siempre lo ha puesto muy fácil).
La interacción con los asistentes personales se limita a hacerle preguntas sobre cualquier cuestión. Ahumada ha ido mucho más allá ya que, además, incorpora tecnología de reconocimiento facial para seguir a la persona con la que está interactuando.
Para que este asistente sea capaz de interactuar de forma visual y a través de comandos de voz, Bender envía las preguntas a ChatGPT para obtener una respuesta en formato texto, respuesta que se pasa a través de Eleven Labs para convertir el texto en una respuesta de voz con la voz, valga la redundancia, de John DiMaggio, que, como hemos comentado más arriba, es la persona que doble a Bender en Estados Unidos.
El uso de la cámara no se limita a seguir al usuario, sino que también se puede utilizar para mostrarle objetos e incluso vídeos para que ofrezca información adicional con su tono sarcástico tan característico. Para llevar a cabo esta funcionalidad, hace uso de OpenCV.
Según podemos ver en el vídeo superior, activando la función de reconocimiento, es capaz de detectar cualquier tipo de contenido y ofrecer información al respecto, ya sean libros o incluso videojuegos retro como Altered Beast a los que juega Ahumada durante el vídeo.
En su interior, se encuentra una Raspberry Pi 5 conectada a un micrófono, un altavoz, la cámara y varios motores se encargan de mover los ojos para dar una mayor sensación de realismo. A diferencia de otros proyectos creados utilizando una Raspberry Pi, la única información disponible para llevar a cabo este proyecto es la misma que hemos compartido en el artículo y que también se encuentra disponible en el vídeo publicado en YouTube que podéis encontrar sobre estas líneas.
Ya sabes, si quieres crear tu propio asistente personal, tan solo necesitas de un Raspberry Pi, ChatGPT para generar las respuestas, OpenCV para reconocer y describir objetos y de Eleven Labs, para que tu asistente tenga la voz del famoso que quieras. No podemos olvidarnos de una impresora 3D para poder darle forma.