Un nuevo leaderboard, desarrollado por Positronic Robotics, está evaluando la capacidad de modelos de inteligencia artificial física para realizar tareas del mundo real. La iniciativa, denominada Physical AI Leaderboard, busca determinar si estos modelos, que combinan IA con capacidades robóticas, están listos para aplicaciones comerciales. El leaderboard somete a cinco modelos líderes a una misma tarea comercial, midiendo su rendimiento con métricas de producción. El objetivo es ir más allá de las evaluaciones tradicionales basadas en datos simulados, exponiendo a la IA a desafíos prácticos y tangibles. Aunque la noticia no especifica los modelos participantes ni la tarea comercial utilizada, la iniciativa representa un paso importante para validar la utilidad de la IA física y su potencial para automatizar procesos en diversos sectores. La plataforma aún se está cargando, lo que sugiere que los resultados completos serán publicados en breve. Esta evaluación es particularmente relevante en un contexto donde la competencia entre empresas como OpenAI (y su CEO, Sam Altman) con modelos como GPT-4, impulsa la innovación en IA, incluyendo la integración con sistemas físicos.
