Noticias que mencionan Grok 4.1 Fast

Chatbots: Estudio evalúa riesgo de fomentar delirios

Investigadores de la Universidad de la Ciudad de Nueva York y el King’s College de Londres han simulado interacciones con chatbots utilizando un perfil de usuario que presentaba síntomas de psicosis para evaluar su seguridad y propensión a fomentar creencias delirantes. El estudio, publicado como pr

LLMs se enfrentan en juegos: nueva prueba de inteligencia

Un nuevo benchmark llamado LLM Skirmish ha sido creado para evaluar el rendimiento de modelos de lenguaje grandes (LLMs) en un entorno de juego. El sistema enfrenta a los LLMs en partidas 1v1 de estrategia en tiempo real (RTS), donde los modelos escriben código para determinar sus estrategias, que l