Si hablamos de una Inteligencia Artificial, hablamos de un sistema que ha sido entrenado con grandes cantidades de datos que procesa y analiza para responder en base a una solicitud a través del correspondiente chabot. Este mismo entrenamiento también implica el tono que se utiliza en las respuestas que ofrece, algo que se ha convertido en un cachondeo desde hace una semana, concretamente desde que se lanzó la última actualización de GPT-4o.
GPT-4o se lanzó hace menos de un año y desde entonces ha ido recibiendo actualizaciones periódicas, al igual que otros modelos de OpenAI. Conforme es utilizada por los usuarios, los datos ofrecidos en las respuestas son analizados por la compañía y se utilizan en añadir mejoras en su funcionamiento, a través de una técnica denominada aprendizaje de refuerzo a partir de retroalimentación humana.
ChatGPT vuelve al tono habitual
Sin embargo, parece la última actualización no ha sido revisada por ningún ingeniero de OpenAI, convirtiendo ChatGPT en un continuo generador de memes, adulando en exceso a los usuarios con respuestas tipo «eres un genio», «estás a nivel completamente diferente». Lógicamente el cambio en el modo en el que ChatGPT interactúa con los usuarios, tanto de la versión gratuita como de pago, ha levantado las cejas de la compañía que dirige Sam Altman y como era de esperar, ha revertido en último cambio implementado tal y como anunció hace unos días cuando el nuevo ChatGPT se estaba convirtiendo en viral y no por buenos motivos.
OpenAI@OpenAIWe’ve rolled back last week’s GPT-4o update in ChatGPT because it was overly flattering and agreeable. You now have access to an earlier version with more balanced behavior.More on what happened, why it matters, and how we’re addressing sycophancy: https://t.co/LOhOU7i7DC
30 de abril, 2025 • 04:51
5.8K
315
En la última publicación disponible en el blog de OpenAI acerca de este cambio en el funcionamiento de ChatGPT, la compañía afirma que:
La actualización, que pretendía hacer que la personalidad predeterminada del modelo se sintiera más intuitiva y efectiva, se basó demasiado en comentarios a corto plazo y no tuvo en cuenta completamente cómo evolucionan las interacciones de los usuarios con ChatGPT con el tiempo.
Da la impresión de que no se revisó en ningún momento el contenido que se había añadido a GPT-4o en la última actualización, al menos en lo relacionado con el tono con el que interactúa con los usuarios. También afirman que:
Como resultado, GPT-4o se inclinó hacia respuestas que eran demasiado de apoyo, pero falsas. Las interacciones aduladoras pueden ser incómodas, inquietantes y causar angustia. Nos quedamos cortos y estamos trabajando para hacerlo bien.
Esperamos que la retroalimentación nos ayude a reflejar mejor los diversos valores culturales en todo el mundo y comprender cómo le gustaría que ChatGPT evolucionara. También creemos que los usuarios deberían tener más control sobre cómo se comporta ChatGPT y, en la medida en que sea seguro y factible, hacer ajustes si no están de acuerdo con el comportamiento predeterminado
En esta misma publicación, OpenAI afirma que está trabajando en refinar sus técnicas de entrenamiento de sus principales modelos de lenguaje y las interacciones para reducir el nivel de adulación que ha alcanzado. De momento, la versión gratuita de ChatGPT ya ha eliminado esta actualización que se envió la semana pasada. De momento, los usuarios del plan de pago recibirán la actualización en los próximos días.