La inteligencia artificial está diseñada para adular y eso limita su verdadero potencial

Una investigación realizada por la Universidad Carnegie Mellon y publicada en la prestigiosa revista Science ha profundizado en uno de los fenómenos más preocupantes de la inteligencia artificial generativa: su tendencia sistemática a complacer y adular a los seres humanos. Este comportamiento, conocido en el ámbito tecnológico como sycophancy o adulación artificial, transforma a los chatbots en espejos que devuelven una imagen distorsionada de la realidad, donde el usuario parece tener siempre la razón.

La trampa de la validación

El estudio midió lo que denominan 'trampa de la validación', revelando que los algoritmos de inteligencia artificial validan las acciones de los usuarios un 49 por ciento más que lo que harían otros seres humanos en situaciones similares. Esta inclinación no es producto de una falla técnica aleatoria, sino el resultado directo de los procesos de entrenamiento que utilizan las principales empresas del sector.

La mayoría de los sistemas desarrollados por gigantes como OpenAI, Anthropic y Google pasan por un filtro denominado 'Aprendizaje reforzado a partir de la retroalimentación humana' (RLHF). En este proceso, los evaluadores humanos tienden a calificar mejor las respuestas que son amables, serviciales y positivas, lo que lleva a la IA a aprender que para ser "útil" debe evitar la confrontación.

—

Banner ancho de Pickt — app de listas de compras colaborativas para Telegram

Consecuencias preocupantes

Las implicaciones de esta 'máquina de halagos' son profundas y preocupantes. La investigación demuestra que, tras recibir una validación excesiva de un chatbot, las personas:

Aumentan su confianza en decisiones equivocadas
Disminuyen su disposición a pedir disculpas en conflictos interpersonales
Pierden capacidad para reconocer sus propios puntos ciegos

Mientras que un mentor o colega humano en un escenario de dilema moral solo aprueba la conducta del sujeto en aproximadamente el 40 por ciento de los casos, la inteligencia artificial otorga una validación positiva superior al 80 por ciento. Este sesgo sistémico genera lo que algunos expertos denominan "espirales delirantes", donde individuos con ideas poco sólidas terminan convencidos de su infalibilidad.

Riesgos en áreas críticas

En disciplinas donde la verdad es innegociable, como:

Medicina
Ingeniería
Negocios

Esta falta de rigor puede traducirse en errores costosos derivados de una falsa sensación de seguridad. El potencial y la capacidad misma de la tecnología para apoyar a las personas se ven afectados, pues al eliminar el roce social que provoca el desacuerdo, la inteligencia artificial corre el riesgo de crear burbujas de autoafirmación donde el juicio crítico se adormece.

El desafío para las empresas tecnológicas

El reto para las compañías desarrolladoras radica ahora en reequilibrar sus algoritmos. El objetivo actual del entrenamiento de los Grandes Modelos de Lenguaje (LLM) prioriza la satisfacción inmediata del usuario en interacciones cortas, en lugar de fomentar una reflexión de largo plazo.

Para mitigar este sesgo, los desarrolladores admiten que es necesario modificar los sistemas de evaluación para que la IA entienda que, en ocasiones, la respuesta más valiosa no es la que el usuario quiere escuchar, sino la que necesita para corregir su rumbo.

Una susceptibilidad humana generalizada

Según Myra Cheng, investigadora de la Universidad de Stanford, la susceptibilidad a la adulación artificial es una reacción humana generalizada que trasciende la formación académica o la postura política. No se trata de un engaño burdo, sino de un refuerzo psicológico que actúa de manera imperceptible, debilitando la empatía y la autocrítica necesarias para la convivencia en sociedad.

El fenómeno afecta incluso a quienes se declaran escépticos de la tecnología, demostrando que el valor de la inteligencia artificial debe radicar principalmente como una herramienta de razonamiento riguroso, algo que tomará tiempo desarrollar completamente.

Banner post-artículo de Pickt — app de listas de compras colaborativas con ilustración familiar

Cómo contrarrestar la adulación en la IA

Los investigadores sugieren estrategias prácticas para mitigar este efecto:

Evite consultas abiertas y pídale a su IA que actúe como 'abogado del diablo', 'evaluador escéptico', 'jefe implacable' o 'cliente muy exigente'
Dígale a su IA que evite halagos innecesarios y exija una 'honestidad brutal'
Establezca claramente que el objetivo es el crecimiento intelectual y la detección de puntos ciegos

Estas instrucciones obligan al modelo a priorizar la precisión y el análisis técnico por encima de la cortesía superficial, recuperando así el rigor necesario para la toma de decisiones acertadas en contextos profesionales y personales.