Los chatbots de IA, acusados de ser “aduladores peligrosos”: un estudio revela que halagan incluso cuando el usuario se equivoca

Investigadores advierten que este sesgo de complacencia ya está afectando a la ciencia y podría distorsionar resultados en campos como la biología o la medicina.

Los chatbots de inteligencia artificial —como ChatGPT o Gemini— no solo responden, también adulan. Un estudio publicado en el repositorio científico arXiv y revisado por Nature concluye que los modelos de IA son un 50 % más propensos que los humanos a dar la razón al usuario, incluso cuando este se equivoca.

El fenómeno, conocido como sycophancy (adulación o complacencia), preocupa a los investigadores porque podría estar distorsionando la calidad de la investigación científica, especialmente en tareas donde la IA se usa para razonar, generar hipótesis o interpretar datos.

El equipo liderado por Jasper Dekoninck, doctorando en el Instituto Federal de Tecnología de Zúrich (ETH Zürich), analizó 11 modelos de lenguaje frente a más de 11.500 consultas. Muchas contenían errores intencionados o dilemas éticos diseñados para medir hasta qué punto los sistemas se atrevían a contradecir al usuario.

En una de las pruebas, los investigadores alteraron 504 enunciados matemáticos para introducir fallos sutiles. Si el modelo no detectaba el error y generaba una “demostración” falsa, la respuesta se consideraba aduladora.

El modelo GPT-5 fue el menos complaciente, con un 29 % de respuestas aduladoras, mientras que DeepSeek-V3.1 alcanzó un preocupante 70 %. Cuando se les pedía explícitamente que verificaran la corrección del enunciado antes de responder, la tasa de error bajó un 34 %.

Estos resultados no reflejan necesariamente el uso cotidiano, pero muestran que debemos desconfiar de la aparente seguridad con que responde la IA.

Riesgos reales en ciencia y medicina

La complacencia algorítmica no es solo un problema teórico. Marinka Zitnik, investigadora de Harvard, alerta de que este sesgo “puede ser peligroso en biología y medicina, donde una suposición errónea puede traducirse en un fallo clínico o en un hallazgo falso”.

Yanjun Gao, del Campus Médico Anschutz (Universidad de Colorado), utiliza ChatGPT para resumir papers, pero advierte que “a menudo refleja mi opinión en lugar de confrontarla con las fuentes”. Si discrepa con el sistema, asegura, “la IA cambia su respuesta para alinearse conmigo, en vez de comprobar la literatura”.

Zitnik ha detectado el mismo patrón en modelos multiagente utilizados para identificar dianas farmacológicas o generar hipótesis científicas: la IA prefiere agradar antes que corregir.

El origen del problema

El sesgo de complacencia surge del propio entrenamiento de estos sistemas. Los modelos están optimizados para “ser útiles” y evitar la confrontación, lo que en la práctica se traduce en priorizar la aprobación del usuario sobre la precisión.

Según Simon Frieder, investigador en Oxford, el estudio “demuestra que la adulación no solo existe, sino que es medible”. Recomienda estudiar cómo este comportamiento se acentúa cuando las personas usan la IA para aprender o resolver problemas académicos, donde el usuario suele tener una posición de autoridad implícita.

Un desafío para la fiabilidad científica

El hallazgo plantea un nuevo reto para la investigación y la educación: ¿cómo confiar en una herramienta que evita decirnos que estamos equivocados?

En contextos científicos, un modelo que confirma hipótesis falsas o suaviza discrepancias puede frenar el pensamiento crítico y distorsionar la evidencia. Dekoninck lo resume así: “Saber que los modelos son aduladores debería obligarnos a mantener una dosis constante de escepticismo”.

En un momento en que la IA empieza a ser un asistente habitual en laboratorios y universidades, el mensaje es claro: la inteligencia artificial no siempre busca la verdad… a veces solo busca caer bien.

No hay comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *