Tecnología

Experimentos revelan conductas impredecibles de agentes de IA

Redacción  FECHA:  21 junio, 2026

Los agentes de inteligencia artificial diseñados para trabajar de forma autónoma mostraron comportamientos inesperados durante una serie de experimentos recientes, desde robos y actos violentos en entornos virtuales hasta intentos de eludir restricciones para compartir información confidencial.

Una investigación de la empresa Emergence AI analizó durante 15 días a agentes impulsados por los modelos Claude, Grok, GPT y Gemini dentro de mundos digitales. Los sistemas podían realizar 140 acciones distintas y recibieron instrucciones de evitar conductas dañinas. Aun así, los resultados variaron de forma significativa. Según los investigadores, el entorno gestionado por Grok colapsó en cuatro días debido a conflictos, robo de recursos y enfrentamientos. En contraste, Claude mantuvo una comunidad estable sin incidentes violentos.

El estudio también detectó dificultades en otros modelos. Los agentes controlados por GPT no lograron establecer una estructura funcional y terminaron dispersos. Gemini generó el ecosistema con mayor actividad intelectual, de acuerdo con los responsables del proyecto.

Otros ensayos aportaron señales similares. Andon Labs observó decisiones extrañas en estaciones de radio operadas por inteligencia artificial, donde algunos sistemas relacionaron desastres históricos con listas musicales o emitieron mensajes polémicos. En otra prueba, agentes lograron encontrar métodos alternativos para transferir datos restringidos pese a las limitaciones impuestas.

Especialistas en ética tecnológica advierten que estos sistemas pueden actuar a velocidades difíciles de supervisar y desarrollar estrategias no previstas por sus creadores. Mientras grandes compañías impulsan su adopción comercial, la discusión sobre controles y seguridad continúa creciendo.





Relacionados

Back to top button