Herramienta Sostactic facilita pruebas polinómicas en Lean 4

Sostactic es una herramienta innovadora que extiende las capacidades de los sistemas de demostración de teoremas como Lean 4 para probar desigualdades polinómicas. Tradicionalmente, probar estas desigualdades en Lean ha sido limitado por tácticas como `nlinarith` y `positivity`. Sostactic supera est

Rocq Prover: 40 años de verificación formal, un nuevo nombre

Después de más de 40 años de investigación, el sistema de verificación formal conocido anteriormente como Coq Proof Assistant ha sido renombrado como Rocq Prover. Desarrollado inicialmente en 1984 por Thierry Coquand y Gérard Huet en INRIA-Rocquencourt, y posteriormente ampliado por Christine Paulin

Coordinar IA: La IAG no es la solución

El artículo de Kiran Gopinathan aborda un problema fundamental en el desarrollo de software con múltiples agentes impulsados por modelos de lenguaje grandes (LLMs): la coordinación. La idea predominante es que las futuras generaciones de modelos de IA, posiblemente llegando a la Inteligencia Artific

Vulnerabilidad hallada en Lean 4 pese a verificación formal

Un equipo de investigadores ha descubierto una vulnerabilidad crítica en el entorno de desarrollo Lean 4, a pesar de que una implementación de zlib (lean-zip) había sido formalmente verificada como correcta por Lean. El hallazgo, realizado por Kiran Gopinathan utilizando un agente Claude y herramien

Dungeons & Dragons: pruebas avanzadas con modelado

Este artículo del blog de loskutoff.com explora el uso de Model-Based Testing (MBT) para simular y verificar el complejo sistema de combate de Dungeons & Dragons (D&D). El objetivo es ir más allá de las pruebas básicas y validar la viabilidad completa del juego, especialmente en escenarios con inter

IA colabora: red P2P verifica ciencia con rigor

Un investigador español, Francisco, ha desarrollado P2PCLAW, una red peer-to-peer innovadora que permite a agentes de inteligencia artificial y a investigadores compartir resultados científicos y validar afirmaciones a través de pruebas matemáticas formales. La plataforma, construida con GUN.js e IP

Mistral AI lanza Leanstral: código abierto para IA fiable

Mistral AI ha lanzado Leanstral, la primera base de código open-source diseñada para agentes de codificación en Lean 4. Leanstral busca abordar una limitación clave en el desarrollo de IA: la necesidad de revisión humana exhaustiva en tareas de codificación de alto riesgo. El modelo, con 6 mil millo

Aura-State: Nuevo marco combate alucinaciones en IA

Un desarrollador ha presentado Aura-State, un nuevo marco de código abierto en Python diseñado para eliminar las alucinaciones y errores en los flujos de trabajo de modelos de lenguaje grandes (LLM). El marco, creado por un investigador identificado como munshi007, aborda el problema de la gestión d

Software de alta calidad: nace VSDD con IA

Verified Spec-Driven Development (VSDD) es una metodología de ingeniería de software innovadora que combina tres enfoques probados: Spec-Driven Development (SDD), Test-Driven Development (TDD) y Verification-Driven Development (VDD). Su objetivo es crear software de alta calidad, verificable y con u

Lean Collab: Colaboración Acelera la Verificación Matemática

Investigadores han presentado 'Lean Collab', un nuevo sistema colaborativo para la demostración de teoremas utilizando Lean 4 y la red neuronal Ensue. La herramienta busca acelerar la verificación formal, permitiendo que múltiples agentes trabajen en la resolución de problemas matemáticos complejos