Un nuevo agente de inteligencia artificial llamado 'Understudy' ha sido desarrollado para automatizar tareas de escritorio al aprender de los usuarios. A diferencia de las herramientas de IA actuales que se centran en interfaces específicas, Understudy opera como un colega virtual, interactuando con el sistema operativo (macOS actualmente) a través de la interfaz gráfica, el navegador, la línea de comandos y el sistema de archivos. El agente aprende observando y replicando tareas, extrayendo la intención detrás de las acciones en lugar de simplemente grabar coordenadas. El proceso de aprendizaje se divide en cinco capas, desde la observación inicial hasta la anticipación proactiva de necesidades, emulando el desarrollo de un nuevo empleado. Las capas 1 y 2 (observación y aprendizaje) están implementadas, mientras que las capas 3 y 4 (optimización de rutas y memoria cristalizada) están en desarrollo. La capa 5, la autonomía proactiva, es un objetivo a largo plazo. Understudy utiliza una arquitectura de doble modelo para la comprensión de la interfaz, permitiendo que las tareas automatizadas se adapten a cambios en la interfaz de usuario. Además, incorpora un sistema de 'enseñanza' para que los usuarios puedan guiar el aprendizaje del agente y publicar habilidades reutilizables.
