aprendizaje profundo

01 Jun 2026

Stanford CS336: un curso para construir un modelo de lenguaje desde cero

Stanford, una de las universidades más prestigiosas del mundo en ciencias de la computación, ha puesto en marcha el curso CS336, una asignatura singular que propone a los estudiantes construir un modelo de lenguaje de gran tamaño (LLM) desde cero, replicando el espíritu de los legendarios cursos de

28 May 2026

IA redefiniendo las redes de centros de datos

El entrenamiento de modelos de inteligencia artificial está redefiniendo la infraestructura de las redes de centros de datos, obligando a abandonar los patrones de tráfico tradicionales de norte a sur por comunicaciones intensivas este-oeste entre miles de GPUs. A diferencia del hosting web tradicio

20 May 2026

Stable Audio 3: IA que genera audio de alta calidad en menos de 2 segundos

Stable Audio 3 representa un avance significativo en la generación de audio mediante inteligencia artificial. Se trata de una familia de modelos de difusión rápida (en sus versiones small, medium y large) capaces de generar y editar audio de longitud variable, desde unos segundos hasta varios minuto

20 May 2026

Universidad Beihang presenta SFHformer, framework que combina FFT y Transformers

Investigadores de la Universidad Beihang de Beijing desarrollaron SFHformer, un nuevo marco de restauración de imágenes que combina la Transformada Rápida de Fourier (FFT) con arquitectura Transformer. El trabajo fue aceptado en la conferencia ECCV 2024 y publicado en octubre de ese año. Este framew

16 May 2026

Presentan Sana-WM: modelo de código abierto que genera videos de alta fidelidad desde una imagen

Sana-WM es un modelo de mundo de código abierto con 2.600 millones de parámetros, diseñado específicamente para generar videos de alta fidelidad con resolución 720p y duración de hasta un minuto a partir de una única imagen y una trayectoria de cámara. Este sistema representa un avance significativo

25 Apr 2026

Aprendizaje profundo: separan modelo y cálculo para más eficiencia

Investigadores de Facebook AI (Meta) han publicado dos nuevos métodos que separan el tamaño del modelo y la potencia computacional en el aprendizaje profundo, desafiando la práctica común de considerarlos como una sola entidad. El primer método, basado en capas de hash, permite aumentar el tamaño de

24 Apr 2026

HN: Investigación de LLM pierde interés

Un análisis reciente realizado por Dylan Castillo revela una disminución en la presencia de investigaciones sobre modelos de lenguaje grandes (LLM) en Hacker News (HN), una plataforma popular entre programadores y entusiastas de la tecnología. Utilizando a Claude, un asistente de IA, Castillo rastre

16 Apr 2026

Red neuronal Transformer corre en Macintosh clásico

MacMind es un proyecto fascinante que demuestra el funcionamiento interno de las redes neuronales, incluso con recursos extremadamente limitados. Se trata de una implementación completa de una red neuronal Transformer de una sola capa, con solo 1.216 parámetros, escrita completamente en HyperTalk, u

28 Mar 2026

ia en retro: transformer corre en ordenador vintage

Un desarrollador ha logrado ejecutar un modelo Transformer de una sola capa en un ordenador vintage PDP-11, un hito que demuestra la capacidad de hardware antiguo para realizar tareas de inteligencia artificial complejas. El proyecto, denominado 'ATTN/11', es una continuación de trabajos anteriores

22 Mar 2026

tinygrad impulsa el aprendizaje profundo con $5M y tinybox

La empresa tinygrad ha recibido una financiación de 5 millones de dólares y ha lanzado 'tinybox', un potente ordenador diseñado para el aprendizaje profundo. Tinygrad, un framework de redes neuronales de rápido crecimiento, se destaca por su simplicidad y eficiencia. La nueva financiación permitirá

18 Mar 2026

Ndea contrata expertos en IA para impulsar AGI

La empresa Ndea, enfocada en el desarrollo de sistemas de Inteligencia Artificial General (AGI), ha anunciado la búsqueda de expertos en IA para unirse a su equipo. La posición, de tiempo completo y remota, requiere investigadores/ingenieros con experiencia práctica en aprendizaje profundo, específi

12 Mar 2026

IA: ¿La experiencia humana ya no es clave?

El ensayo de Guy Freeman, "La Lección Amarga No Tiene Función de Utilidad", aborda una desconexión importante en la comunidad de Inteligencia Artificial (IA). La "Lección Amarga" de Rich Sutton, popularizada en 2019, argumenta que los métodos generales que aprovechan la computación superan consisten

10 Mar 2026

LoGeR: Nueva técnica reconstruye 3D de videos largos

LoGeR (Long-Context Geometric Reconstruction with Hybrid Memory) es un nuevo enfoque para la reconstrucción 3D de videos de larga duración, un problema que hasta ahora ha sido extremadamente desafiante debido a limitaciones tanto de cálculo como de datos. Tradicionalmente, la reconstrucción 3D impli

09 Mar 2026

ia: ¿por qué ignoramos matemáticas más eficientes?

Este artículo explora por qué métodos matemáticos superiores a los utilizados actualmente en inteligencia artificial (IA) han caído en desuso, a pesar de su eficacia. El autor, Guy Freeman, argumenta que no se trata de una cuestión de superioridad técnica, sino de una combinación de factores históri

01 Mar 2026

Ingeniero simplifica modelos GPT a 200 líneas de código

Un ingeniero ha simplificado significativamente los modelos de lenguaje grandes (LLM) como GPT, creando una versión funcional en tan solo 200 líneas de código Python. Esta hazaña, denominada 'microgpt', representa un hito en la accesibilidad y comprensión de la tecnología detrás de herramientas como

28 Feb 2026

Ajedrez: Función Hard-Swish frena a motor NNUE

Un investigador ha experimentado con nuevas funciones de activación, específicamente Swish y SwiGLU, en el modelo NNUE de Viridithas, un motor de ajedrez. Inicialmente, la sustitución de las funciones SCReLU en las capas L₁ y L₂ con Hard-Swish provocó una disminución significativa en la eficiencia d

26 Feb 2026

LiDAR: Datos de onda revelan detalles cruciales

El LiDAR (Light Detection and Ranging) se ha convertido en una tecnología esencial para la conducción autónoma, proporcionando escaneos 3D de alta resolución que permiten una comprensión precisa del entorno. Tradicionalmente, los sensores LiDAR miden la intensidad de la luz láser reflejada en funció

22 Feb 2026

Redes neuronales: error hacia adelante, un nuevo enfoque

Este artículo de investigación explora una pregunta fundamental en el entrenamiento de redes neuronales recurrentes (RNN): ¿por qué la retropropagación a través del tiempo (BPTT) siempre se ejecuta hacia atrás? Los autores proponen y derivan un algoritmo que propaga el error hacia adelante en el tie

20 Feb 2026

IA: ¿Homogeneiza la creatividad?

El artículo "AI makes you boring" plantea una crítica inusual sobre el impacto de la inteligencia artificial (IA) en la creatividad y la calidad de las discusiones técnicas, más allá de la simple eficiencia en el desarrollo de software. No se trata de un rechazo a la IA como herramienta, sino de una

15 Feb 2026

Alibaba crea RynnBrain: IA que 've' y comprende el mundo

RynnBrain es un modelo de base encarnado (embodied foundation model) desarrollado por Alibaba Damo Academy, diseñado para comprender e interactuar con el mundo físico de una manera más profunda que los modelos de lenguaje tradicionales. Imagina un modelo que no solo entiende el lenguaje, sino que ta

15 Feb 2026

DjVu: el formato de archivo que aprende

DjVu es un formato de archivo diseñado para comprimir documentos escaneados, especialmente libros y documentos técnicos, de manera mucho más eficiente que el formato PDF. Aunque menos conocido hoy en día, su superioridad radica en su capacidad para manejar imágenes y texto de forma inteligente, a di

11 Feb 2026

GLM-OCR: Nuevo OCR de Código Abierto Lidera en Precisión

Investigadores han desarrollado GLM-OCR, un nuevo modelo de código abierto para el reconocimiento óptico de caracteres (OCR) que alcanza un rendimiento de vanguardia en la comprensión de documentos complejos. Basado en la arquitectura GLM-V encoder-decoder, GLM-OCR incorpora técnicas innovadoras com