StepFun lanza Step 3.7 Flash con visión multimodal y eficiencia

Fuentes: Step 3.7 Flash introduces improved agent efficiency and multimodal understanding
StepFun lanza Step 3.7 Flash con visión multimodal y eficiencia
Imagen generada con IA

StepFun ha lanzado Step 3.7 Flash, un modelo de inteligencia artificial de alta eficiencia diseñado para optimizar el rendimiento de los agentes en entornos reales. Esta nueva versión se centra en la comprensión multimodal y la ejecución de tareas complejas, permitiendo entender imágenes, documentos y gráficos para actuar sobre ellos mediante código o herramientas. El modelo destaca por su compatibilidad con ecosistemas populares como Claude Code y KiloCode, logrando mejoras significativas en benchmarks de programación y ejecución de tareas. Utilizando un modo 'Advisor', alcanza un 97% de la capacidad de modelos de mayor tamaño a un noveno de su costo. Además, supera a sus predecesores en búsqueda web y tareas visuales, compensando su tamaño mediante herramientas de búsqueda y código Python para competir con modelos de mayor escala.