formal verification

04 Jun 2026

GitHub presenta una implementación formalmente verificada de la intersección de polígonos

Un repositorio de GitHub ha sido publicado con una implementación formalmente verificada de un algoritmo para la intersección de polígonos, un logro significativo en el campo de la geometría computacional. El proyecto, liderado por schildep, utiliza el asistente de demostración de teoremas Lean 4 pa

29 May 2026

Meta lanza ATLAS para traducir libros a código matemático formal

ATLAS es una biblioteca masiva de matemáticas formalizadas, desarrollada por Facebook Research, que traduce libros de texto universitarios y de posgrado a código formal utilizando modelos de lenguaje grande (LLMs). Su importancia radica en acelerar el proceso de verificación matemática, permitiendo

19 Apr 2026

Herramienta Sostactic facilita pruebas polinómicas en Lean 4

Sostactic es una herramienta innovadora que extiende las capacidades de los sistemas de demostración de teoremas como Lean 4 para probar desigualdades polinómicas. Tradicionalmente, probar estas desigualdades en Lean ha sido limitado por tácticas como `nlinarith` y `positivity`. Sostactic supera est

18 Apr 2026

Rocq Prover: 40 años de verificación formal, un nuevo nombre

Después de más de 40 años de investigación, el sistema de verificación formal conocido anteriormente como Coq Proof Assistant ha sido renombrado como Rocq Prover. Desarrollado inicialmente en 1984 por Thierry Coquand y Gérard Huet en INRIA-Rocquencourt, y posteriormente ampliado por Christine Paulin

14 Apr 2026

Coordinar IA: La IAG no es la solución

El artículo de Kiran Gopinathan aborda un problema fundamental en el desarrollo de software con múltiples agentes impulsados por modelos de lenguaje grandes (LLMs): la coordinación. La idea predominante es que las futuras generaciones de modelos de IA, posiblemente llegando a la Inteligencia Artific

14 Apr 2026

Vulnerabilidad hallada en Lean 4 pese a verificación formal

Un equipo de investigadores ha descubierto una vulnerabilidad crítica en el entorno de desarrollo Lean 4, a pesar de que una implementación de zlib (lean-zip) había sido formalmente verificada como correcta por Lean. El hallazgo, realizado por Kiran Gopinathan utilizando un agente Claude y herramien

10 Apr 2026

Dungeons & Dragons: pruebas avanzadas con modelado

Este artículo del blog de loskutoff.com explora el uso de Model-Based Testing (MBT) para simular y verificar el complejo sistema de combate de Dungeons & Dragons (D&D). El objetivo es ir más allá de las pruebas básicas y validar la viabilidad completa del juego, especialmente en escenarios con inter

19 Mar 2026

IA colabora: red P2P verifica ciencia con rigor

Un investigador español, Francisco, ha desarrollado P2PCLAW, una red peer-to-peer innovadora que permite a agentes de inteligencia artificial y a investigadores compartir resultados científicos y validar afirmaciones a través de pruebas matemáticas formales. La plataforma, construida con GUN.js e IP

17 Mar 2026

Mistral AI lanza Leanstral: código abierto para IA fiable

Mistral AI ha lanzado Leanstral, la primera base de código open-source diseñada para agentes de codificación en Lean 4. Leanstral busca abordar una limitación clave en el desarrollo de IA: la necesidad de revisión humana exhaustiva en tareas de codificación de alto riesgo. El modelo, con 6 mil millo

05 Mar 2026

Aura-State: Nuevo marco combate alucinaciones en IA

Un desarrollador ha presentado Aura-State, un nuevo marco de código abierto en Python diseñado para eliminar las alucinaciones y errores en los flujos de trabajo de modelos de lenguaje grandes (LLM). El marco, creado por un investigador identificado como munshi007, aborda el problema de la gestión d

28 Feb 2026

Software de alta calidad: nace VSDD con IA

Verified Spec-Driven Development (VSDD) es una metodología de ingeniería de software innovadora que combina tres enfoques probados: Spec-Driven Development (SDD), Test-Driven Development (TDD) y Verification-Driven Development (VDD). Su objetivo es crear software de alta calidad, verificable y con u

12 Feb 2026

Lean Collab: Colaboración Acelera la Verificación Matemática

Investigadores han presentado 'Lean Collab', un nuevo sistema colaborativo para la demostración de teoremas utilizando Lean 4 y la red neuronal Ensue. La herramienta busca acelerar la verificación formal, permitiendo que múltiples agentes trabajen en la resolución de problemas matemáticos complejos