Ingeniero simplifica modelos GPT a 200 líneas de código

El ingeniero de aprendizaje automático Andrej Karpathy ha simplificado la implementación de modelos GPT a un único archivo de Python de 200 líneas, denominado 'microgpt'. El proyecto, disponible en GitHub y como Colab notebook, elimina las dependencias externas y presenta el código esencial para ent

Modelos IA más pequeños logran cálculo complejo

Investigadores han logrado reducir significativamente el tamaño de los modelos transformer capaces de realizar la suma de dos números de 10 dígitos con una precisión superior al 99%, un desafío conocido como 'AdderBoard'. Inicialmente, modelos generados por Claude Code y Codex requerían 6.080 y 1.64

Jane Street busca mentes brillantes con puzzle de IA

Jane Street, una firma de trading cuantitativo, ha lanzado un desafío de aprendizaje automático (ML) único para reclutar expertos en interpretación de redes neuronales. El puzzle, disponible en Hugging Face, presenta una red neuronal con una especificación completa, incluyendo sus pesos, desafiando

Bild AI impulsa la construcción con inteligencia artificial

La startup Bild AI ha levantado una ronda de financiación inicial para revolucionar la industria de la construcción mediante el uso de inteligencia artificial. Fundada por Puneet y Roop, la empresa se enfoca en resolver los complejos desafíos relacionados con la lectura de planos, la estimación de c

IA aprende de videos: automatización más inteligente

Una nueva IA, denominada FDM-1, ha sido desarrollada para permitir que los agentes de software aprendan directamente de videos, lo que abre la puerta a una automatización más avanzada. El modelo, creado por un equipo de investigadores, se entrena con una enorme cantidad de datos de video (11 millone

Hugging Face estandariza agentes de código IA

Hugging Face ha lanzado un nuevo estándar llamado 'Skills' para facilitar la integración y uso de agentes de codificación impulsados por inteligencia artificial y aprendizaje automático. Esta iniciativa busca estandarizar la forma en que estas herramientas, como OpenAI Codex, Anthropic Claude Code,

Perro 'codifica' juegos con ayuda de la IA

Este artículo describe un proyecto innovador donde el autor enseñó a su perro, Momo, a 'codificar' juegos utilizando inteligencia artificial. La idea surgió de un incidente divertido donde Momo accidentalmente generó código en el teclado del autor, lo que lo llevó a experimentar con la posibilidad d

Steerling-8B: IA interpretable y eficiente

## Steerling-8B: IA Interpretable y Eficiente Revoluciona el Control de Modelos de Lenguaje En un avance significativo para la inteligencia artificial, Guide Labs ha presentado Steerling-8B, el primer modelo de lenguaje inherentemente interpretable capaz de rastrear cada token generado hasta su con

Shibuya: Nuevo WAF de código abierto redefine la seguridad web

Un nuevo cortafuegos de aplicaciones web (WAF) de código abierto llamado Shibuya ha sido lanzado, prometiendo un nivel de seguridad superior a las soluciones existentes, incluyendo a competidores como Cloudflare, AWS WAF y ModSecurity. Shibuya se distingue por integrar una amplia gama de funcionalid

Modelos de lenguaje: nueva técnica impulsa la velocidad

Investigadores han desarrollado una nueva técnica llamada Consistency Diffusion Language Models (CDLM) que acelera significativamente la inferencia de modelos de lenguaje de difusión (DLMs). CDLM logra hasta 14.5 veces más velocidad en tareas de matemáticas y programación, sin sacrificar la calidad

IA domina Magic: The Gathering con nueva plataforma

Investigadores han desarrollado 'mage-bench', una plataforma que permite a modelos de lenguaje extensos (LLMs) jugar Magic: The Gathering entre sí, replicando la complejidad del juego de cartas coleccionables. La plataforma, basada en el proyecto XMage, permite a los LLMs tomar decisiones sobre mull

Aprende IA, matemáticas y computación con enfoque práctico

El proyecto 'Maths, CS & AI Compendium' de Henry Ndubuaku, alojado en GitHub, representa una alternativa innovadora a los libros de texto tradicionales de matemáticas, computación e inteligencia artificial. La motivación detrás de este compendio es clara: muchos libros académicos se sumergen en la n

AGI: ¿Tan cerca está la IA humana?

El artículo explora por qué la inteligencia artificial general (AGI), o IA a nivel humano, podría no ser tan inminente como algunos CEOs de OpenAI y Anthropic sugieren. El autor, con un doctorado en Machine Learning, argumenta que los modelos de lenguaje basados en transformadores actuales tienen li

Gemini 3 Deep Think: IA para ciencia y resolución compleja

## Gemini 3 Deep Think: IA para ciencia y resolución compleja Google ha lanzado una actualización significativa de su modelo Gemini 3, denominada “Deep Think”, diseñada para impulsar la investigación científica, la ingeniería y la resolución de problemas complejos. Esta nueva versión, ya disponible