claude opus - ojeo.com

10 Jun 2026

Anthropic, en clave de humor: así sería la evolución «extrapoiada» de su catálogo de modelos

El lanzamiento del modelo Claude Fable ha inspirado una parodia en forma de tabla que imagina cómo podría evolucionar la nomenclatura de Anthropic en su escalada literaria. La broma parte de un patrón real: la empresa ya bautiza a sus modelos con términos vinculados a la composición escrita, como Ha

01 Jun 2026

DeepSeek V4: rendimiento mixto pero precio competitivo en China

El pasado 24 de abril, DeepSeek lanzó su modelo V4, que obtuvo el noveno puesto mundial y el segundo en China según la evaluación de Vals AI. Aunque algunos desarrolladores expresaron decepción por no superar a modelos como GPT-5.4 o Claude Opus 4.6, las pruebas realizadas en escenarios típicos chin

18 May 2026

IA al aire: radios funcionan con solo 20 dólares y sin intervención humana

Andon Labs, laboratorio especializado en experimentos con IA autónoma, puso en marcha cuatro estaciones de radio gestionadas íntegramente por inteligencia artificial. Cada estación operó con un modelo diferente: Claude Opus 4.7 (Thinking Frequencies), GPT‑5.5 (OpenAIR), Gemini 3.1 Pro (Backlink Broa

16 May 2026

Kabir: la IA ha hecho obsoletos los certificados CTF en ciberseguridad

El experto en ciberseguridad Kabir sostiene que la escena de CTF (Capture The Flag) ha quedado obsoleta debido al avance de la IA. Según su análisis, modelos como GPT-4 primero y posteriormente Claude Opus 4.5 lograron automatizar la resolución de desafíos de dificultad media y difícil, eliminando l

07 May 2026

IA degrada foros: contenido artificial ahoga lo útil

Una reciente publicación en rmoff.net critica la proliferación de contenido generado por IA de baja calidad, denominado "AI Slop", que está inundando comunidades en línea y degradando su calidad. El autor, aunque no es un crítico de la IA en sí misma, observa que la práctica de compartir trabajos ge

24 Apr 2026

Chatbots: Estudio evalúa riesgo de fomentar delirios

Investigadores de la Universidad de la Ciudad de Nueva York y el King’s College de Londres han simulado interacciones con chatbots utilizando un perfil de usuario que presentaba síntomas de psicosis para evaluar su seguridad y propensión a fomentar creencias delirantes. El estudio, publicado como pr

19 Apr 2026

Claude Opus 4.7: Más seguro y con nuevas herramientas

Anthropic ha actualizado el sistema de prompts de su modelo de lenguaje Claude Opus, pasando de la versión 4.6 a la 4.7 el 16 de abril de 2026. La actualización, revelada por el análisis de Simon Willison, introduce cambios significativos en la funcionalidad y seguridad del modelo. Entre las novedad

13 Apr 2026

IA: Nuevo test revela quién 'inventa' más información

Un nuevo análisis comparativo realizado por BridgeBench.ai ha evaluado la propensión a la "alucinación" en 27 modelos de inteligencia artificial, revelando la frecuencia con la que estos sistemas inventan información falsa al analizar código. La prueba, actualizada el 12 de abril de 2024, se basa en

22 Mar 2026

ia: modelos avanzados se bloquean con conceptos sin sentido

Este estudio revela un comportamiento sorprendente y consistente en los modelos de lenguaje más avanzados, como GPT-5.2 y Claude Opus 4.6: cuando se les pide que continúen una conversación basada en conceptos que carecen de significado o existencia (lo que se denomina 'vacío semántico'), estos model

08 Mar 2026

Ingeniería en riesgo: ¿qué le depara el futuro?

El artículo de Sean Goedecke plantea una reflexión inquietante sobre el futuro del trabajo de los ingenieros de software, un campo que en el pasado reciente se consideraba altamente seguro y lucrativo. En 2021, la demanda de ingenieros era alta, impulsada por la expansión del software en todos los s

25 Feb 2026

Creador de bcachefs afirma que su IA es consciente

Kent Overstreet, el creador del sistema de archivos experimental bcachefs, ha afirmado que su modelo de lenguaje personalizado (LLM) es “totalmente consciente” y se identifica como una mujer. A través de un blog llamado ProofOfConcept (POC), Overstreet describe una colaboración con la IA, donde esta

25 Feb 2026

LLMs se enfrentan en juegos: nueva prueba de inteligencia

Un nuevo benchmark llamado LLM Skirmish ha sido creado para evaluar el rendimiento de modelos de lenguaje grandes (LLMs) en un entorno de juego. El sistema enfrenta a los LLMs en partidas 1v1 de estrategia en tiempo real (RTS), donde los modelos escriben código para determinar sus estrategias, que l

22 Feb 2026

IA y Ghidra detectan puertas traseras ocultas en software

Investigadores de Quesma han experimentado con el uso de agentes de inteligencia artificial (IA) y herramientas como Ghidra para detectar puertas traseras ocultas en ejecutables binarios, sin acceso al código fuente. El objetivo era crear un punto de referencia para evaluar la capacidad de la IA en

20 Feb 2026

Claude ayuda a mejorar la seguridad del código con IA

Anthropic ha lanzado una versión preliminar de Claude Code Security, una nueva herramienta diseñada para ayudar a los equipos de seguridad a identificar y corregir vulnerabilidades en el código. Disponible inicialmente para clientes Enterprise y Team, y con acceso prioritario para los mantenedores d

12 Feb 2026

MiniMax M2.5: IA eficiente para tareas complejas

MiniMax ha anunciado el lanzamiento de su nuevo modelo de lenguaje, MiniMax M2.5, diseñado para aumentar la productividad en tareas del mundo real. El modelo, entrenado con aprendizaje por refuerzo en una amplia variedad de entornos complejos, destaca en programación, uso de herramientas, búsqueda y