ia: ¿por qué no aprende como nosotros?

Fuentes: Why AI systems don't learn and what to do about it: Lessons on autonomous learning from cognitive science

El artículo "Why AI systems don't learn and what to do about it: Lessons on autonomous learning from cognitive science" plantea una crítica fundamental a la forma en que actualmente se construyen los sistemas de Inteligencia Artificial, argumentando que carecen de la capacidad de aprendizaje autónomo que caracteriza a los seres humanos y los animales. La IA moderna, a pesar de sus impresionantes logros en tareas específicas (como jugar al ajedrez o generar texto), esencialmente memoriza patrones a partir de grandes cantidades de datos. Esto no es aprendizaje en el sentido de comprender los principios subyacentes que rigen el mundo y poder aplicar ese conocimiento a situaciones nuevas e imprevistas.

El problema, según los autores, radica en que los sistemas de IA actuales se basan principalmente en el aprendizaje supervisado o por refuerzo, que requieren una gran cantidad de datos etiquetados o una definición precisa de la recompensa. Esto limita su capacidad de explorar y descubrir por sí mismos. El artículo propone una nueva arquitectura de aprendizaje inspirada en la cognición animal y humana, que integra dos sistemas principales: un sistema de aprendizaje por observación (System A) y un sistema de aprendizaje por comportamiento activo (System B). System A permite al sistema aprender observando el entorno y las acciones de otros, mientras que System B permite al sistema experimentar y aprender de sus propios errores.

Lo crucial es la introducción de un tercer componente, System M (meta-control), que actúa como un director de orquesta, alternando entre los modos de aprendizaje A y B según las necesidades y el contexto. Este sistema de meta-control es esencial para la adaptabilidad y la eficiencia del aprendizaje. Imaginemos un robot que aprende a caminar: inicialmente, podría observar a un humano caminando (System A). Luego, intentaría caminar por sí mismo, corrigiendo su postura y movimientos a través de la retroalimentación (System B). System M decidiría cuándo observar, cuándo intentar, y cómo ajustar el equilibrio entre ambos.

Aplicaciones y Casos de Uso: Esta arquitectura podría ser aplicada en robótica, donde los robots necesitan adaptarse a entornos cambiantes y aprender nuevas tareas sin una programación explícita. También es relevante para el desarrollo de agentes de IA que puedan interactuar de manera más natural con los humanos, aprendiendo de sus acciones y adaptándose a sus preferencias. En el campo de la investigación médica, podría facilitar el desarrollo de sistemas de diagnóstico que aprendan de la experiencia de los médicos, pero también de datos no estructurados como imágenes y notas clínicas.

Consideraciones: La implementación de esta arquitectura presenta desafíos técnicos significativos. Desarrollar un sistema de meta-control robusto y eficiente es complejo. Además, la integración de los sistemas A y B requiere una cuidadosa coordinación para evitar conflictos y asegurar un aprendizaje coherente. Una alternativa, aunque menos ambiciosa, sería mejorar las técnicas de aprendizaje por refuerzo, incorporando elementos de aprendizaje por observación. El artículo subraya que la verdadera IA autónoma requiere un cambio de paradigma en la forma en que diseñamos y entrenamos los sistemas de IA, alejándonos de la simple memorización y acercándonos a una comprensión más profunda del mundo.