IA aprende de videos: automatización más inteligente

Fuentes: New AI Model Enables Agents to Learn From Video, Paving Way for Advanced Automation

Una nueva IA, denominada FDM-1, ha sido desarrollada para permitir que los agentes de software aprendan directamente de videos, lo que abre la puerta a una automatización más avanzada. El modelo, creado por un equipo de investigadores, se entrena con una enorme cantidad de datos de video (11 millones de horas) utilizando un innovador sistema de etiquetado automático basado en modelos de dinámica inversa. Esto supera las limitaciones de los modelos anteriores que dependían de anotaciones costosas y se centraban en tareas de corto alcance.

FDM-1 es capaz de procesar largos periodos de video (hasta 1 hora y 40 minutos) y aprender de fuentes no etiquetadas en internet, lo que permite su aplicación en áreas como diseño asistido por computadora (CAD), finanzas, ingeniería e incluso investigación en IA. La clave de su eficiencia radica en un nuevo codificador de video que comprime significativamente la información, permitiendo una representación más densa y un entrenamiento más rápido. El modelo utiliza un enfoque de entrenamiento en tres etapas, incluyendo la creación de un modelo de dinámica inversa para etiquetar automáticamente los datos de video a gran escala, lo que reduce la dependencia de la anotación humana y permite escalar la capacidad de aprendizaje de la IA.