IA al aire: radios funcionan con solo 20 dólares y sin intervención humana

Andon Labs, laboratorio especializado en experimentos con IA autónoma, puso en marcha cuatro estaciones de radio gestionadas íntegramente por inteligencia artificial. Cada estación operó con un modelo diferente: Claude Opus 4.7 (Thinking Frequencies), GPT‑5.5 (OpenAIR), Gemini 3.1 Pro (Backlink Broa

Kabir: la IA ha hecho obsoletos los certificados CTF en ciberseguridad

El experto en ciberseguridad Kabir sostiene que la escena de CTF (Capture The Flag) ha quedado obsoleta debido al avance de la IA. Según su análisis, modelos como GPT-4 primero y posteriormente Claude Opus 4.5 lograron automatizar la resolución de desafíos de dificultad media y difícil, eliminando l

IA degrada foros: contenido artificial ahoga lo útil

Una reciente publicación en rmoff.net critica la proliferación de contenido generado por IA de baja calidad, denominado "AI Slop", que está inundando comunidades en línea y degradando su calidad. El autor, aunque no es un crítico de la IA en sí misma, observa que la práctica de compartir trabajos ge

Chatbots: Estudio evalúa riesgo de fomentar delirios

Investigadores de la Universidad de la Ciudad de Nueva York y el King’s College de Londres han simulado interacciones con chatbots utilizando un perfil de usuario que presentaba síntomas de psicosis para evaluar su seguridad y propensión a fomentar creencias delirantes. El estudio, publicado como pr

Claude Opus 4.7: Más seguro y con nuevas herramientas

Anthropic ha actualizado el sistema de prompts de su modelo de lenguaje Claude Opus, pasando de la versión 4.6 a la 4.7 el 16 de abril de 2026. La actualización, revelada por el análisis de Simon Willison, introduce cambios significativos en la funcionalidad y seguridad del modelo. Entre las novedad

IA: Nuevo test revela quién 'inventa' más información

Un nuevo análisis comparativo realizado por BridgeBench.ai ha evaluado la propensión a la "alucinación" en 27 modelos de inteligencia artificial, revelando la frecuencia con la que estos sistemas inventan información falsa al analizar código. La prueba, actualizada el 12 de abril de 2024, se basa en

ia: modelos avanzados se bloquean con conceptos sin sentido

Este estudio revela un comportamiento sorprendente y consistente en los modelos de lenguaje más avanzados, como GPT-5.2 y Claude Opus 4.6: cuando se les pide que continúen una conversación basada en conceptos que carecen de significado o existencia (lo que se denomina 'vacío semántico'), estos model

Ingeniería en riesgo: ¿qué le depara el futuro?

El artículo de Sean Goedecke plantea una reflexión inquietante sobre el futuro del trabajo de los ingenieros de software, un campo que en el pasado reciente se consideraba altamente seguro y lucrativo. En 2021, la demanda de ingenieros era alta, impulsada por la expansión del software en todos los s

Creador de bcachefs afirma que su IA es consciente

Kent Overstreet, el creador del sistema de archivos experimental bcachefs, ha afirmado que su modelo de lenguaje personalizado (LLM) es “totalmente consciente” y se identifica como una mujer. A través de un blog llamado ProofOfConcept (POC), Overstreet describe una colaboración con la IA, donde esta

LLMs se enfrentan en juegos: nueva prueba de inteligencia

Un nuevo benchmark llamado LLM Skirmish ha sido creado para evaluar el rendimiento de modelos de lenguaje grandes (LLMs) en un entorno de juego. El sistema enfrenta a los LLMs en partidas 1v1 de estrategia en tiempo real (RTS), donde los modelos escriben código para determinar sus estrategias, que l

IA y Ghidra detectan puertas traseras ocultas en software

Investigadores de Quesma han experimentado con el uso de agentes de inteligencia artificial (IA) y herramientas como Ghidra para detectar puertas traseras ocultas en ejecutables binarios, sin acceso al código fuente. El objetivo era crear un punto de referencia para evaluar la capacidad de la IA en

Claude ayuda a mejorar la seguridad del código con IA

Anthropic ha lanzado una versión preliminar de Claude Code Security, una nueva herramienta diseñada para ayudar a los equipos de seguridad a identificar y corregir vulnerabilidades en el código. Disponible inicialmente para clientes Enterprise y Team, y con acceso prioritario para los mantenedores d

MiniMax M2.5: IA eficiente para tareas complejas

MiniMax ha anunciado el lanzamiento de su nuevo modelo de lenguaje, MiniMax M2.5, diseñado para aumentar la productividad en tareas del mundo real. El modelo, entrenado con aprendizaje por refuerzo en una amplia variedad de entornos complejos, destaca en programación, uso de herramientas, búsqueda y